Методика оценки защищенности речевой информации от утечки по техническим каналам с учетом форсирования речи тема диссертации и автореферата по ВАК РФ 05.13.19, кандидат наук Иванов Андрей Валерьевич

  • Иванов Андрей Валерьевич
  • кандидат науккандидат наук
  • 2015, ФГБОУ ВО «Томский государственный университет систем управления и радиоэлектроники»
  • Специальность ВАК РФ05.13.19
  • Количество страниц 136
Иванов Андрей Валерьевич. Методика оценки защищенности речевой информации от утечки по техническим каналам с учетом форсирования речи: дис. кандидат наук: 05.13.19 - Методы и системы защиты информации, информационная безопасность. ФГБОУ ВО «Томский государственный университет систем управления и радиоэлектроники». 2015. 136 с.

Оглавление диссертации кандидат наук Иванов Андрей Валерьевич

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИЗ МЕТОДИКИ ОЦЕНКИ РАЗБОРЧИВОСТИ РЕЧИ И ПОСТАНОВКА НОВЫХ АРТИКУЛЯЦИОННЫХ ИСПЫТАНИЙ ДЛЯ ФОРСИРОВАННОЙ РЕЧИ

1.1 Методика оценки защищенности речевой информации

1.2 Постановка артикуляционных испытаний для форсированной речи

1.3 Сопоставление данных, полученных расчетным путем по методике оценки защищенности речевой информации и по результатам артикуляционных испытаний

Выводы по главе

ГЛАВА 2. УСОВЕРШЕНСТВОВАНИЕ МЕТОДИКИ ОЦЕНКИ ЗАЩИЩЕННОСТИ РЕЧЕВОЙ ИНФОРМАЦИИ С УЧЕТОМ ЭФФЕКТА ФОРСИРОВАНИЯ

2.1 Вводные замечания

2.2 Экспериментальное обоснование ширины частотного диапазона, оцениваемого при оценке защищенности речевой информации

2.3 Обоснование выбора типа полосового разбиения частотного диапазона, оцениваемого при оценке защищенности речевой информации

2.4 Рассмотрение возможности учета при оценке защищенности речевой информации преобразований происходящих в человеческом ухе

2.5 Экспериментальное определение функции распределения формант и зависимости словесной разборчивости от формантной

2.6 Экспериментальное определение амплитудного состава речи

2.7 Определение зависимости коэффициента восприятия от уровня ощущений для форсированной речи

2.8 Функция расчета необходимого уровня шума от средств защиты для выполнения определенного уровня разборчивости речи

2.9 Определение и учет коэффициента экстремальности для определения максимально возможного значения разборчивости речи

2.10 Рассмотрение многоканальной метода съема информации

Выводы по главе

ГЛАВА 3. СОПОСТАВЛЕНИЕ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

3.1 Общие замечания

3.2 Порядок проведения измерений и расчетов по методике оценки защищенности речевой информации с учетом эффекта форсирования

3.3 Сопоставление результатов по скорректированной методике и артикуляционным испытаниям

Выводы по главе

ГЛАВА 4. РАЗРАБОТКА И РЕАЛИЗАЦИЯ ПРОГРАММНО-АППАРАТНОГО КОМПЛЕКСА, ПРОИЗВОДЯЩЕГО ОЦЕНКУ ЗАЩИЩЕННОСТИ РЕЧЕВОЙ ИНФОРМАЦИИ С УЧЕТОМ ЭФФЕКТА ФОРСИРОВАНИЯ

4.1 Требования к характеристикам комплекса

4.2 Реализация аппаратной части

4.3 Программное обеспечение комплекса

Вывод по главе

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ А

ПРИЛОЖЕНИЕ Б

ВВЕДЕНИЕ

Рекомендованный список диссертаций по специальности «Методы и системы защиты информации, информационная безопасность», 05.13.19 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методика оценки защищенности речевой информации от утечки по техническим каналам с учетом форсирования речи»

Актуальность темы исследования.

Во все времена защите информации (ЗИ) уделялось огромное внимание. Несмотря на развитие и широкое использование средств вычислительной техники и представления информации в цифровом виде, на речевую акустическую информацию приходится значительная доля всех информационных ресурсов, подлежащих защите.

Говоря о речевой информации, прежде всего, имеется ввиду проведение переговоров, совещаний и т.д. При подготовке помещений для проведения подобных мероприятий особое внимание уделяется оценке возможности утечки речевой акустической информации по техническим каналам. Оценка защищенности данных каналов рассматривает возможность получения информации за пределами помещения, в котором ведутся переговоры. Утечка информации по акустическому и виброакустическому каналам возможна через ограждающие и инженерные конструкции помещения (стены, пол, потолок, окна, вентиляции, системы водоснабжения и отопления и т.д.). Для того, чтобы гарантировать отсутствие утечки информации по данным каналам необходимо провести целый ряд измерений и расчетов, по результатам которых делается вывод о защищенности информации, либо о необходимости применения дополнительных средств или мер защиты (активных, пассивных и организационных).

В качестве критерия оценки защищенности речевой информации в России принято использовать коэффициент словесной разборчивости (Ж).

Для определения разборчивости речи существует два основных подхода: субъективный и объективный [61]. Субъективный подход подразумевает использование групп дикторов и аудиторов. Дикторы озвучивают различные элементы речевой информации (фразы, слова, слоги, звуки), аудиторы записывают услышанную информацию, а затем полученные результаты оцениваются и вычисляется разборчивость речи, как

отношение правильно услышанных единиц речи к их общему количеству. Данный подход считается наиболее достоверным, но требование использования групп тренированных дикторов и аудиторов, трудоемкость оценки результатов, длительность проведения оценки делают затруднительным использование данного метода в задачах защиты информации. При оценке защищенности помещения для проведения переговоров в среднем необходимо определить коэффициент разборчивости речи в 2-3х десятках контрольных точек. Что приводит к необходимости применения объективного подхода (расчет по определенным зависимостям разборчивости речи на основании изменений параметров акустических сигналов).

Теория разборчивости речи основывается на исследованиях таких авторов, как Покровский Н.Б., Сапожков М.А., Быков Ю.С.. Существует множество объективных методов оценки разборчивости речи, как отечественных, так и зарубежных [22, 64]

В задачах защиты информации оценка словесной разборчивости проводится по методике, разработанной Хоревым А.А., Желязняком В.К. и Макаровым Ю.К.[44] на базе формантного метода Покровского Н.Б[61].

Работы в области оценки защищенности речевой информации от утечки по техническим каналам ведутся многими исследователями: Хорев А.А.[44, 85], Железняк В.К.[43, 44], Авдеев В.Б.[1], Продеус А.Н.[19, 20, 21, 22, 41, 42, 62], Каргашин В.Л. [48,49] и др.

В качестве измерительного оборудования в методике используют измерители шума и вибрации, анализаторы спектра, автоматизированные программно-аппаратные комплексы (ПАК).

Существует множество вопросов, касающихся корректности данной методики и обоснованности характеристик используемого измерительного оборудования, в частности:

• базовые зависимости, лежащие в основе методики, получены при условиях, существенно отличающихся от условий защиты информации;

• не учитывается возможность форсирования речи;

• не обоснована достаточность уровня тестового сигнала соответствующего среднему уровню речи;

• не обоснован и не подтвержден экспериментально выбор именно октавного разбиения частотного диапазона, а также ширины исследуемого частотного диапазона.

Работы по оценке разборчивости речи (Н.Б. Покровский, Ю.С. Быков, М.А. Сапожков и др.) начались в середине прошлого века и были ориентированы на оценку качества каналов связи. Для получения базовых зависимостей были поставлены артикуляционные испытания, суть которых заключалась в субъективной оценке разборчивости речи. Артикуляционные таблицы были составлены таким образом, чтобы их элементы (слова, слоги и т.д.) были максимально не коррелированы. В задачах же защиты информации ситуация абсолютно противоположная. Все беседы, переговоры, совещания, по сути, представляют собой осмысленные связные тексты. Если злоумышленник не расслышал какие-то отдельные слова, то он может легко восстановить их, исходя из сути разговора. Кроме того, не составляет труда записать речевую информацию на диктофон и затем подвергнуть уже многократному прослушиванию и различным методам фильтрации, что также существенно увеличивает разборчивость речи [31, 32, 35, 86].

При проведении переговоров в реальных ситуациях возможно также возникновение эффекта форсирования речи. Форсированием называется повышение уровня речи, вызванное усиленным напряжением голосовых связок [61]. Помимо повышения общего уровня речи, форсирование сопровождается также перераспределением энергии в пределах спектра, максимум энергии смещается в область высоких частот, что влияет на вклад частотных полос в суммарную разборчивость. Как известно, существует зависимость изменения коэффициента восприятия от уровня мешающего шума [61, стр. 209, стр. 214], что необходимо учитывать в случае форсирования речи, а также при использовании средств активной защиты

(САЗ). Уровни мешающих шумов могут достигать 80-90 дБ. Следовательно, зависимость коэффициента восприятия от уровня ощущений, используемая в общепринятой методике [44], не соответствует условиям защиты информации и требует корректировки.

В работе Авдеева В.Б. [1] указывается на недостаточность уровня тестового сигнала равного 70 дБ (средний уровень речи). Данный уровень возможно определить зная функцию распределения амплитудного состава речи. Известная зависимость амплитудного состава речи, приведенная Покровским Н.Б. [61, стр. 115, стр. 148] была получена в условиях, отличающихся от условий проведения измерений в задачах ЗИ: расстояние до микрофона было 8 см (в задачах ЗИ - 1м.), исследования не проводились для форсированной речи. Таким образом, встает вопрос о необходимости переоценки амплитудного состава речи как для обычной речи, так и для форсированной.

Также следует рассмотреть возможность применения различных подходов к оценке результатов артикуляционных испытаний [1]: традиционный алгоритм усреднения по ансамблю экспертов или выделение только результатов с максимальными значениями разборчивости речи (т.е. использование результатов самых «слышащих» аудиторов). По результатам использования данных подходов для анализа результатов артикуляционных испытаний возможно высчитать поправочный «коэффициент экстремальности», который можно будет использовать при оценке защищенности речевой информации по более «жестким» требованиям.

Остается открытым вопрос обоснованности выбора измерительного оборудования и его характеристик. Даже с учетом широкого спектра технических средств, применяемых для обработки и записи акустической информации, конечным «анализатором» полученной речевой информации всегда является человек. Логично предположить, что характеристики измерительного оборудования должны соответствовать возможностям органов человеческого слуха, то есть переход от измеренных параметров

акустических сигналов к характеристике восприятия данных сигналов человеком должен осуществляться на основе адекватной модели уха.

Целью диссертационной работы является усовершенствование общепринятой методики оценки защищенности речевой информации от утечки по техническим каналам (методика оценки разборчивости речи) с учетом эффекта форсирования.

Для достижения цели в работе поставлены и решены следующие задачи:

1. Постановка и проведение артикуляционных испытаний в условиях обычной и форсированной речи.

2. Экспериментальное подтверждение необходимой ширины частотного диапазона.

3. Экспериментальное определение достаточных уровней тестового сигнала для обычной и форсированной речи.

4. Корректировка базовых зависимостей методики оценки защищенности речевой информации для учета эффекта форсирования.

5. Определение «коэффициента экстремальности», позволяющего переходить от значений разборчивости речи, соответствующих усредненным результатам артикуляционных испытаний, к значениям, соответствующим результатам наиболее слышащих аудиторов.

6. Разработка методики расчета необходимого уровня шумов от средств активной защиты для обеспечения заданного уровня защищенности речевой информации.

7. Проектирование и реализация программно-аппаратного комплекса оценки защищенности речевой информации.

Объект исследования - проблема достоверной оценки защищенности речевой информации от утечки по техническим каналам.

Предмет исследования - методика оценки разборчивости речи с учетом эффекта форсирования.

Методы исследования. В работе использованы положения теории разборчивости речи, теории измерений, методы и программы обработки речевых сигналов.

Научная новизна результатов исследования:

1. Усовершенствована методика оценки защищенности речевой информации (методика оценки разборчивости речи), отличающаяся от общепринятого подхода учетом эффекта форсирования речи, позволяющая повысить достоверность оценки защищенности помещений. Базовые зависимости методики оценки разборчивости речи с учетом эффекта форсирования были получены впервые (пункт 9, 10 паспорта специальности 05.13.19).

2. Впервые введен в методику оценки защищенности речевой информации «коэффициента экстремальности», позволяющий переходить от значений разборчивости речи, соответствующих усредненным результатам артикуляционных испытаний, к значениям, соответствующим результатам наиболее «слышащих» аудиторов (пункт 9, 10 паспорта специальности 05.13.19).

3. Впервые разработана методика расчета оптимального спектра и уровня помехи от средств активной защиты (генераторов шума) для получения заданного значения разборчивости речи, позволяющая ускорить и упростить процесс настройки средств защиты (пункт 10 паспорта специальности 05.13.19).

Практическая значимость. Результаты исследований могут быть использованы как в учебном процессе при подготовке специалистов по защите информации, так и в практической - организациями лицензиатами ФСТЭК России, профессионально занимающимися оценкой защищенности информации, разработкой методик, созданием ПАК оценки защищенности речевой информации. С учетом полученных результатов разработан и реализован ПАК для оценки защищенности речевой информации (и для

спокойной, и для форсированной речи), как по общепринятой, так и по усовершенствованной методике.

Соответствие диссертации паспортам научных специальностей.

Отраженные в диссертации научные положения соответствуют областям исследования по специальности 05.13.19 - «Методы и системы защиты информации, информационная безопасность» в части пунктов 9, 10 её паспорта, а именно:

• п.9. Модели и методы оценки защищенности информации и информационной безопасности объекта.

• п.10. Модели и методы оценки эффективности систем (комплексов) обеспечения информационной безопасности объектов защиты.

Достоверность результатов диссертационной работы подтверждается соответствием полученных теоретических результатов и выводов экспериментальным данным, а также положительными результатами апробации и внедрения.

Реализация и внедрение результатов работы. Результаты теоретических и экспериментальных исследований нашли применение в учебном процессе кафедры защиты информации Новосибирского государственного технического университета при подготовке специалистов по направлению «Информационная безопасность». Разработанный ПАК, реализующий возможность оценки защищенности речевой акустической информации от утечки по техническим каналам с учетом полученных в работе результатов и методика переданы в опытную эксплуатацию НвсФ ФГУП НТЦ «Атлас» и ООО «АТЦ» (лицензиаты ФСТЭК России). Соответствующие акты о внедрении представлены в приложении А.

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на международных и всероссийских научно-технических конференциях и получили положительную оценку: XII Всероссийская научно-практическая конференция «Проблемы информационной безопасности государства, общества и личности» (г.

Барнаул, 2010г.); Международная конференция «Актуальные Проблемы Электронного Приборостроения (АПЭП)» (г. Новосибирск, 2010г.); XIII Всероссийская научно-практическая конференция «Проблемы информационной безопасности государства, общества и личности» (г. Новосибирск, 2012г.); X Белорусско - Российская научно - техническая конференция «Технические средства защиты информации» (г. Минск, БГУИР 2012г.); XI Белорусско - Российская научно - техническая конференция «Технические средства защиты информации» (г. Минск, БГУИР 2013г.); Международный конгресс по информатике: информационные системы и технологии CSIST'2013 (г. Минск, БГУ 2013г.); The 8th International Forum on Strategic Technology IFOST 2013 (Ulaanbaatar, Mongolian University of Science and Technology); Международная конференция «Актуальные Проблемы Электронного Приборостроения (АПЭП)» (г. Новосибирск, 2014г.); Международная научно-техническая конференция «Автоматизация: проблемы, идеи, решения (АПИР-14)» (г. Севастополь, 2014 г); International Siberian conference on control and communications (SIBCON-2015), Omsk, 2015.

Научные публикации. По теме диссертации опубликовано 16 научных работ, в числе которых 7 в рецензируемых научных журналах, 8 в сборниках трудов международных и всероссийских конференций, 2 из которых входят в базу данных SciVerse Scopus.

Личный вклад автора. В диссертации использованы результаты, в которых автору принадлежит определяющая роль. Некоторые из опубликованных работ написаны в соавторстве с сотрудниками научной группы. Автором проведены и спланированы артикуляционные испытания для условий форсированной и обычной речи, проведено сопоставление результатов полученных по существующей методике с результатами артикуляционных испытаний. Проведено усовершенствование методики оценки защищенности речевой информации с учетом эффекта форсирования речи, коэффициента экстремальности, разработана методика расчета

необходимого уровня шума при заданном уровне защищенности, сформированы требования к измерительному оборудованию, предложены варианты реализации программно-аппаратного комплекса, разработан программно-аппаратный комплекс для проведения оценки защищенности речевой информации. Постановка задач исследований осуществлялась научным руководителем, к.т.н., старшим научным сотрудником В.А. Трушиным.

Основные положения диссертации, выносимые на защиту:

1. Результаты артикуляционных испытаний со связными текстами для форсированной речи показали, что перераспределение энергии в спектре речи при форсировании влияет на разборчивость, из чего следует необходимость исследования и пересмотра основных зависимостей методики оценки защищенности для возможности учета эффекта форсирования речи (пункт 9, 10 паспорта специальности 05.13.19).

2. Усовершенствованная методика оценки защищенности речевой информации (оценка разборчивости речи), которое позволяет учитывать эффект форсирования речи и получать данные, сопоставимые с результатами артикуляционных испытаний. Данное усовершенствование проведено на основании результатов экспериментального определения достаточной ширины анализируемого частотного диапазона, функции распределения формант и амплитудного состава речи при форсировании, а также анализа органов слуха человека (пункт 9, 10 паспорта специальности 05.13.19).

3. «Коэффициент экстремальности», позволяющий осуществлять переход от значений разборчивости речи, соответствующих усредненным результатам артикуляционных испытаний, к значениям, соответствующим результатам наиболее «слышащих» аудиторов. Данный подход может использоваться для оценки защищенности по более строгим требованиям (пункт 9, 10 паспорта специальности 05.13.19).

4. Методика расчета оптимального спектра и уровня помехи от средств активной защиты (генераторов шума) для получения заданного значения разборчивости речи (пункт 10 паспорта специальности 05.13.19).

5. Программно-аппаратный комплекс оценки защищенности речевой информации, реализующий усовершенствованную и общепринятую методики, возможность применения различных разбиений частотного диапазона (5 или 7 октавных полос, «критические полосы»), учет «коэффициента экстремальности», методику расчета оптимальной помехи для средств активной защиты (пункт 9, 10 паспорта специальности 05.13.19).

Структура диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и 2-х приложений. Общий объем работы составляет 136 страниц (с приложениями), включая 72 рисунка, 19 таблиц. Список литературы содержит 122 наименования.

ГЛАВА 1. АНАЛИЗ МЕТОДИКИ ОЦЕНКИ РАЗБОРЧИВОСТИ РЕЧИ И ПОСТАНОВКА НОВЫХ АРТИКУЛЯЦИОННЫХ ИСПЫТАНИЙ ДЛЯ

ФОРСИРОВАННОЙ РЕЧИ

1.1 Методика оценки защищенности речевой информации

Как уже говорилось, в качестве критерия оценки защищенности речевой информации принято использовать коэффициент словесной разборчивости (Ж).

Разборчивость речи - это отношение количества правильно принятых элементов речи (звуков, слогов, слов, фраз) к общему количеству переданных.

Для оценки словесной разборчивости речи в задачах защиты информации используется методика, разработанная Хоревым А.А., Желязняком В.К. и Макаровым Ю.К.[44] на базе формантного метода Покровского Н.Б [61].

Форманта - ключевое понятие в теории разборчивости речи. Под формантой понимается значение максимума концентрации энергии в спектре звука [78]. Каждый звук имеет несколько формант и свою индивидуальную спектральную огибающую (рис 1.1), отражающую расположение формант на частотной оси, соотношение их уровней и характер изменения.

| Частота анализа х 1 Эффекты П Линейный вид

Удержание: [1][2][з][4|

А Г \

/\ Уv J V \1 \ \ [\ дл.

200 300 400 500 000 000

2000 3000 4000 5000 7000

Курсор: 64.59 Нг, -49.19 с1В Линии » Размер РРТ:

Частота: 119.98 Нг (В2 -49) Справка: [~0 ] дЕКС (В буфер

Сканер выборки Дополнительно |

Рис. 1.1. Спектр звука «О» в Adobe Audition

Суть методики заключается в следующем [44].

• Разбиение всего частотного диапазона на 5 октавных полос со среднегеометрическим частотами: 250, 500, 1000, 2000, 4000 Гц.

Среднегеометрическая частота:

fcpi = V/hi * fm (1.1)

где fHi, fHi соответственно верхняя и нижняя границы i-й частотной полосы.

• В каждой октавной полосе проводится измерение уровней акустического давления шума Lni и смеси сигнал + шум L(s+n)i (в дБ относительно порога слышимости = 2- 10-5Па);

В качестве измерительного оборудования в методике используют измерители шума и вибрации, анализаторы спектра, автоматизированные программно-аппаратные комплексы (ПАК).

• Вычисление уровня сигнала для каждой октавной полосы:

LSi = 10 • iog(iö01-b(5+n)i - 1Q0-1-Lni) (1.2)

• Вычисление уровня ощущений для каждой октавной полосы:

Qi = LSi-Lni-AAi (1.3)

где AAt - формантное превышение

Значения формантного параметра AAt определяются из соотношения:

AA(f) =

f 200

(20-з- 0'37' если f < 1000Гц 1'37 + , если f > 1000 Гц (14)

ДА: дБ

зо-

15 10

5 а

!К> 1x1с3 1x10'

£ Гц

Рис. 1.2. Разность между спектральными уровнями речи и формант

График на рис. 1.2 получен путем разности значений спектрального уровня речи и спектрального уровня формант на определенной частоте. На рис. 1.3 приведены спектральный уровень речи - В и спектральный уровень формант - ВЛ (для спокойной речи с интегральным уровнем 70 дБ).

50 45 40 35 30 25 20 15

10 ■ , ......

5------------------

01--

100 1х103 1х104

£ Гц

Рис. 1.3. Спектральный уровень речи - В и спектральный уровень

формант - В\

• Для каждой октавной полосы на среднегеометрической частоте определяется коэффициент восприятия формант (рис. 1.4), представляющее собой вероятное относительное количество формантных соотношений речи, которые будут иметь уровни интенсивности выше порогового значения.

(1.5)

Рис. 1.4. Зависимость коэффициента восприятия формант -р от относительного уровня ощущений формант - Q

0.78 + 5.46-ехр[-4.3-10-3-(27.3-|^|) 1

„ , -^та-- если(>^0;

Р1 = < г 21

0.78 + 5.46^хр|-4.3^10-3<27.3-|^|) I

1---——-г-,-- - еслиО; > 0;

• Вычисление формантной разборчивости речи производится по следующим формулам:

Ъ = Рь- Ь

Я =

(1.6)

(1.7)

Следует заметить, что только формантная разборчивость обладает свойством аддитивности по частоте, поскольку каждая частотная полоса вносит свой определенный вклад в суммарную разборчивость.

кI - вклад /-той октавной полосы в суммарную разборчивость, характеризующий вероятность наличия формант речи в данной полосе:

Ь = к(Гв1) -ед^) (1.8)

где ) и ) - значение весового коэффициента для верхней /В и нижней граничной частоты /-й октавной полосы спектра речевого сигнала.

Значение весовых коэффициентов ) и к() определяется по графику на рис. 1.5 или из соотношения:

= Г 2,57 * 10-8 * /24, если 100 < / < 400 Гц, (1 9)

(/) (1 - 1,074 * ехр(—10-4 * /1Д8), если 400 < /< 10000 Гц. ( . )

Рис. 1.5. Формантное распределение

• От значения формантной разборчивости Я переходят к словесной разборчивости W с помощью графика на рис. 1.6 или соотношения:

1.54 •Я025 [1 - ехр(—11 •Я)], если Я < 0.15

Формантная разборчивость К

Рис. 1.6. Зависимость словесной разборчивости речи W

от формантной Я.

Существует множество вопросов касающихся корректности данной методики, в частности:

• базовые зависимости, лежащие в основе методики, получены при условиях, существенно отличающихся от условий защиты информации, а именно:

- артикуляционные таблицы были максимально некоррелированный, в задачах ЗИ мы имеем дело со связной речью, что позволяет аудитору понять те слова которые не были им распознаны по общему содержанию переговоров;

- не учитывалась возможность проведения звукозаписи исследуемой речи, а, следовательно, многократного прослушивания ее аудитором;

- не учитывалась возможность применения методов шумоочистки;

- и т.д.

• не учитывалась возможность форсирования речи, то есть повышения уровня речи, вызванного усиленным напряжением голосовых связок (по предположению Н.Б. Покровского, помимо повышения общего уровня и суммарной интенсивности спектра речи, форсирование сопровождается также перераспределением энергии в пределах спектра, что требует переоценки всех зависимостей в методике оценки разборчивости речи в случае форсирования);

• не обоснована достаточность уровня тестового сигнала соответствующего среднему уровню речи (зависимости амплитудного состава речи Н.Б. Покровским были получены при условии что источник звука находился в 8 см от микрофона, в задачах ЗИ все измерения производятся на расстоянии 1 м, для форсированной речи амплитудный состав не оценивался);

• не обоснован и не подтвержден экспериментально выбор именно октавного разбиения частотного диапазона (конечным «анализатором» речевых сообщений является человек, соответственно частотное разбиение нужно производить с учетом разрешающей способности человеческого уха), а также ширины исследуемого частотного диапазона (необходима постановка эксперимента для определения границ частотного диапазона в котором присутствуют речевые составляющие, способные внести вклад в разборчивость речи).

1.2 Постановка артикуляционных испытаний для форсированной речи

Как уже было сказано, форсирование сопровождается не только увеличением интегрального уровня речи диктора, но и перераспределением

энергии в спектре. Характер изменения частотного спектра при форсировании представлен на рис. 1.7 [61, стр. 201]:

Рис. 1.7. Частотный спектр форсированной речи при различной степени

форсирования

Как видно из рисунка существуют различные степени форсирования, характеризующиеся параметром АВ от 0 дБ (речь без форсирования) и 14 дБ (максимальная степень форсирования).

Степень форсирования напрямую зависит от уровня воздействующего шума, данная зависимость приводится Н.Б. Покровским [61, стр. 200] (рис. 1.8):

70 75 ВО 85 90 ПО

Рис. 1.8. Зависимость приращения суммарного уровня речи от уровня шума, воздействующего на диктора

Вопрос оценки вероятности возникновения эффекта форсирования требует отдельной работы и выходит за рамки данных исследований.

При оценке защищенности помещения от утечки речевой информации необходимо учесть максимально неблагоприятные ситуации, то есть эффект форсирования предлагается рассматривать и учитывать в его максимальной степени. Следуя приведенной зависимости для достижения максимально степени форсирования необходимо создавать шум возле уха диктора с интегральным уровнем порядка 100 дБ.

Для достижения форсирования речи, при постановке эксперимента, во время записи речи, диктору через наушники подается шумовой сигнал такого уровня, чтобы диктору приходилось повышать голос, чтобы услышать самого себя.

Шум, подаваемый в наушники, может быть как приближенным к спектру речевых сигналов («речевой хор»), так и иметь постоянную спектральную плотность (белый шум). Для практического подтверждения был проведен следующий эксперимент: производилась запись одного и того же фрагмента речи одним и тем же диктором в условиях, различающихся только типом воздействующей помехи; в качестве мешающего шума использовались помеха типа «речевой хор» и белый шум. Белый шум был сгенерирован ПО Adobe Audition, а помеха «речевой хор» получена путем многократного наложения друг на друга различных отрезков речи разных дикторов до такой степени, чтобы на слух были различимы только звуки.

Похожие диссертационные работы по специальности «Методы и системы защиты информации, информационная безопасность», 05.13.19 шифр ВАК

Список литературы диссертационного исследования кандидат наук Иванов Андрей Валерьевич, 2015 год

/ \

\ /

\ /

\ / ГГ

\

\ 1_ _

^— - — — — - _!

Не 1 0 1 * « (ГТ г 10 . . » 0 40 0 50 т~а щ 10 0» ГнГ

Курсо| 21870 Нг, -112.2 с)В 14 Размер РРТ: • Частота : 120,3 Нг (В2 СправкаМо 1 дБКС | В буфер 45) | Сканер выборки 11 Дополнительно |

Рис. 2.5. Спектр аудиозаписи после применения подавляющего фильтра 180-5600Гц

После фильтрации производится прослушивание полученной аудиозаписи и подсчитывается количество правильно услышанных слов относительно общего количества слов в аудиозаписи (определяется словесная разборчивость субъективным методом).

Данный алгоритм применяется последовательно ко всем аудиозаписям.

Результаты показали, что на всех аудиозаписях и у всех аудиторов словесная разборчивость составила 0.90-1.00 (то есть 90-100%) .

Исходя из полученных результатов, можно сделать вывод о необходимости применения более широкого диапазона частот для анализа.

Будем постепенно расширять полосу подавляющего фильтра до тех пор, пока не добьемся W = 0 (словесная разборчивость станет равна 0, невозможно различить ни одного слова).

2. Полоса частот 90-5600Гц.

Уменьшив нижнюю границу диапазона до 90 Гц (нижняя граница 1 октавы при 7-ми октавном разбиении) добились следующих результатов: разборчивость составила 0.74-0.80, требуется более тщательное

многократное прослушивание, неслышны только отдельные слова, но в большинстве случаев о них можно догадаться по смыслу).

В речи дикторов значительно снизилось количество гласных звуков. Это подтверждает мнение многих авторов о расположении формант гласных звуков в низкочастотной области. Но также утверждается, что больший вклад в словесную разборчивость вносят согласные звуки [5, 61, 70], форманты которых располагаются в области высоких частот. Данными утверждениями можно обосновать полученные результаты.

Продолжим эксперимент в области высоких частот, будем постепенно увеличивать верхнюю частоту полосового подавляющего фильтра и фиксировать полученные результаты.

3. Полоса частот 90-7000Гц.

W=0.23-0.30, можно разобрать словосочетания, восстановить суть разговора уже сложно, но современном мире иногда достаточно и утечки одного слова, стоимость которого может быть очень велика.

4. Полоса частот 90-8000Гц.

W<0.10, можно различить только некоторые слова.

5. Полоса частот 90-10000Гц.

W=0, но явно можно утверждать о факте наличия разговора.

6. Полоса частот 90-13000Гц.

Факт наличия разговора пропадает только при подавлении полосы 9013000Гц.

Результаты эксперимента в удобной для анализа форме представлены в табл. 2.1. Табл. 2.1

Полоса частот подавляющего фильтра, Гц Разборчивость речи

180-5600 0,9-1,0

90-5600 0,74-0,87

90-7000 0,23-0,3

90-8000 <0,1

90-10000 0

90-13000 отсутствие факта наличия разговора

Данный результат так же подтверждает мнения многих авторах о диапазоне частот речевых сигналов (рис. 2.6) [5]:

Рис. 2.6. Область слышимости речевых сигналов, ограниченная по частоте и интенсивности для русской речи

Для сравнения приводится график области слышимости для английской речи приведенный в работе [94, р.107] (рис. 2.7).

Рис. 2.7. Область слышимости речевых сигналов, ограниченная по частоте и интенсивности для английской речи

Как видно, для английской речи, частотная область значительно уже, что лишний раз указывает на то что формантный подход нужно адаптировать (исследовать изменение базовых зависимостей) под каждый язык.

Таким образом, для корректной оценки словесной разборчивости необходимо исследовать диапазон частот от 90-10000Гц, если же стоит цель исключить получение информации даже о самом факте ведения разговора, то необходимо исследовать диапазон 90-13000Гц. Полученные результаты говорят о необходимости расширения частотного диапазона, исследуемого при оценке защищенности речевой информации.

2.3 Обоснование выбора типа полосового разбиения частотного

диапазона, оцениваемого при оценке защищенности речевой

информации

Существует множество различных видов разбиения частотного диапазона: октавный (5ти и 7ми), треть октавный, равноартикуляционный и т.д. Вопрос обоснования выбора одного из них до сих пор не поднимался. Чем выше уровень дискретности (больше количество полос) тем результаты должны быть точнее, потому что любое разбиение спектра на полосы это усреднение реального процесса. Так как в работах [41, 108, 109, 117] было доказано, что помехи с различными спектрами по разному влияют на защищенность речевой информации при одинаковых интегральных уровнях, то уменьшение количества частотных полос на одном и том же диапазоне будет приводить к снижению достоверности учета эффективности влияния помех.

Можно предположить, что октавное разбиение используется потому, что большинство шумомеров работают с таким разбиением, соответственно данное разбиение было принято, чтобы можно было использовать существующую измерительную технику. Но в наше время широко распространены аналогово-цифровые преобразователи (АЦП) и в большинстве программно-аппаратных комплексов для оценки разборчивости речи измеряемый сигнал сначала оцифровывается, а затем уже посредствам

программного обеспечения реализуются алгоритмы расчета интегральных уровней в частотных полосах.

Плюсы равноартикуляционного разбиения в том, что весь диапазон разбивается на 20 полос, следовательно, погрешность измерения будет меньше, и в том, что весовые коэффициенты каждой из полос будут одинаковы, что в свою очередь упрощает расчеты. Но расчеты легко автоматизируются и нет проблемы рассчитать весовые коэффициенты для любого частотного разбиения.

Более существенные недостатки данных разбиений в том, что в каждом из них присутствуют «широкие» полосы. Сейчас не будем рассматривать случай с применением для защиты генераторов шума - средств активной защиты (САЗ), которые проходят обязательную сертификацию, и качество «излучаемых» ими шумов соответствует нормам. Рассматриваем случай без применения САЗ, когда защищенность помещения для ведения переговоров оценивается звукопоглощающими свойствами ограждающих конструкций. При измерениях, в фоновых шумах могут присутствовать помехи с достаточно «узкой» полосой частот, либо ограждающие конструкции могут не равномерно поглощать акустический сигнал, и будут возникать «узкие» полосы, в которых отношение сигнал/шум будет значительно выше полученного при измерении октавы, в которую попадает эта узкая полоса. А при наличии в спектре нескольких таких участков возможно с легкостью отфильтровать наш сигнал и восстановить содержание разговора. Да и в случае применения САЗ могут возникнуть такие случаи.

Для исключения подобных ситуаций можно предложить разбиение частотного диапазона на «критические полосы». «Критические полосы» - это полосы соответствующие разрешающей способности человеческого уха, человеческое ухо не может различить по частоте два сигнала находящихся в пределах одной критической полосы. Также существенно утверждение других авторов о том, что при попадании маскируемого (наш защищаемый речевой сигнал) и маскирующего (фоновые шумы или шум от САЗ) сигналов

в одну критическую полосу эффективность маскировки значительно возрастает [4, 5, 70, 101]. А так как конечным «анализатором» обрабатывающим защищаемый сигнал является человеческое ухо, то логично предложить, что измерения разборчивости речи необходимо проводить с разбиением соответствующим «критическим полосам». График зависимости ширины «критической полосы» от частоты приведен на рис. 2.8.

=г и

Л

о

1=

«

X

3

К

э

Центргшьная частота Б, Гц

Рис. 2.8. Зависимость ширины «критической полосы» (АР) от центральной частоты Также в литературе приводятся аналитические зависимости описывающие данный график [18, стр. 145]:

= 25 + 75(1 + 1.4 • ^2)0'69 (2.1)

В данном вопросе нет различия в русском или иностранных языках, данная зависимость описывает именно свойства органов слуха, на которые не влияют особенности языка. Тем более, что эксперимент по определению грани частотных полос строился на использовании тональных сигналов или полосовых шумов [88, стр. 83; 18, стр. 144]. На рис. 2.9. приводятся

результаты измерений, по которым проводилось усреднение и определение данной зависимости.

2000 1000 500

200 100

50 _ _ _____ _______________ ___________ .

0,1 0.2 0.5 1 2 5 10 ^ср. кГц

Рис. 2.9. Зависимость ширины «критической полосы» (АР) от центральной частоты, с указанием экспериментальных точек Какого-то однозначного разбиения на критические полосы частот не существует, у человеческого уха нет определенных начальных и конечных частот одной из таких полос, существует только зависимость ширины критической полосы» (АБ) от средней частоты. Поэтому проведем расчет одного из вариантов данного разбиения для выбранного нами ранее диапазона частот 90-10000Гц, а также весовых коэффициентов, необходимых для расчета словесной разборчивости по общепринятой методике.

Интерполировав данный график и реализовав в МЛТЬЛБ алгоритм определения границ частотных полос, проходом всего частотного диапазона с шагом 1 Гц и определением ширины полосы для /-ой частоты, и, как только нижняя граница /-ой полосы совпадет с границей полосы (/-1), данная центральная частота фиксируется и начинается аналогичный цикл для определения границ и середины следующей частотной полосы.

Весовые коэффициенты были рассчитан по следующей формуле [87]:

. 2.57 • Ю-8 •Г24, если 100 < /< 400Гц к(П = 1 1П-4л18 (2.1)

\1 - 1.074 • е-10 'Г . , если 400 < [ < 10000Гц

Результаты расчета границ частотных полос и соответствующих им весовых коэффициентов приведены в табл. 2.2. Табл. 2.2

Начальная частота, Гц Конечная частота, Гц Средне геометрическая частота, Гц Весовые коэффициенты

90 182 136 0,005

182 278 230 0,013

278 381 330 0,023

381 496 439 0,043

496 622 559 0,046

622 762 692 0,052

762 916 839 0,055

916 1087 1002 0,055

1087 1280 1184 0,054

1280 1503 1392 0,057

1503 1764 1634 0,075

1764 2071 1918 0,078

2071 2434 2253 0,074

2434 2869 2652 0,069

2869 3395 3132 0,062

3395 4033 3714 0,055

4033 4840 4437 0,057

4840 5880 5360 0,053

5880 7218 6549 0,036

7218 8940 8079 0,022

8940 11340 10140 0,008

Зависимость ширины «критической полосы» (Д^) от средней частоты (рис. 2.8) близка к аналогичной зависимости для 1/3-октавного разбиениея частотного диапазона [94, p.59] (рис. 2.10).

Рис. 2.10. Зависимость ширины «критической» (Classical) и 1/3-октавной (1/3 Octave) полос от центральной частоты

Использование 1/3-октавного разбиения облегчает выбор измерительного оборудования (практически во всех измерительных шумомерах присутствует данная функция), но оно отдаляет нас от приближения измерительного процесса к реальной ситуации.

Рассмотрим вопрос влияния различного разбиения частотного диапазона на результат разборчивости речи. Произведем расчет по скорректированной методике, но используя различные разбиения частотного диапазона на полосы («критические полосы», 7 октавных полос, 5 октавных полос), чтобы показать влияние выбора данного параметра. Для примера рассчитаем зависимости разборчивости речи от соотношения сигнал/шум для случая формантоподобной помехи (рис. 2.11)

0.6

& 0.4 £

ё 0.3 т я

а 0.2

о ш

-15 -14 -13 -12 -11 -10 -9 -3 -7 -б -5

Соотношение сигнал/шум, дБ

Рис. 2.11. Зависимости разборчивости речи от соотношения сигнал/шум, рассчитанные по скорректированной методике для случая форсированной речи, при использовании следующих разбиений на частотные полосы: 21 «критическая полоса», 7 октавных полос, 5 октавных полос.

Очевидно, что при уменьшении дискретности частотного диапазона (уменьшении количества частотных полос) возникают существенные расхождения в результатах расчета. Из графика видно, что, при рассмотрении частотного диапазона одной и той же ширины от 90 Гц до 11.2 кГц, но с разбиениями на 21 «критическую полосу» и 7 октавных полос, разница в результатах может достигать 35% разборчивости речи (ДW = 0.35), что в вопросах защиты информации недопустимо. Также видно, что исключение из рассмотрения при октавном разбиении 1ой и 7ой октавных полос (рис 3.17 -5 октав) тоже может приводить к ошибке в расчетах до 20% (ДW = 0.20). Можно сделать вывод, что уменьшая количество частотных полос, даже при сохранении одной и той же ширины частотного диапазона, уменьшается достоверность оценки влияния спектра помехи на разборчивость речевой информации.

Таким образом, оптимальным является разбиение частотного диапазона на «критические полосы». Данное разбиение существенно снижает возможность возникновения ошибок при измерениях, возможное усложнение

1 1 1 1 > 1 * J J

-21 крит. полоса ---- 7 октав ----- 5 октав

.р I I р •

1 : 1 ■

> I з ■

} Г

данным образом методики расчета легко компенсируется использованием для расчета программных методов.

2.4 Рассмотрение возможности учета при оценке защищенности речевой информации преобразований происходящих в человеческом ухе

Как уже отмечалось, конечным «анализатором» речевой информации является человек, следовательно, невозможно производить измерения и расчет показателей защищенности без учета характеристик человеческого уха. Ухо представляет собой сложную систему с разделением на несколько отделов, каждый из которых вносит преобразования во входящий акустический сигнал (рис. 2.12).

Усиление

Преобразование акустического

Нелинейные Полосовые преобразования фильтры

Аналогово-цифровое преобразование

t

Полости с жидкостью Базилярная мембрана Орган Корти

Центральная -> нервная система

I Внутреннее ухо

I______________________________I

Рис. 2.12. Блок-схема отделов человеческого уха Работы по изучению процессов преобразования сигналов в ухе человека ведутся уже давно (С.Н. Ржевкин (1928г.) [66], E. Zwicker, R. Feldtkeller (1967г.) [88], М.А. Сапожков (1989г.) [70], И.А. Алдошина (2006г.) [4, 5] и др.), но из-за сложности проведения исследований (необходимо проводить измерения именно в живом ухе человека), объективных результатов (измеренных) по передаточной характеристике человеческого уха до сих пор не существует. Единой модели процессов преобразования

сигналов в человеческом ухе нет. Все имеющиеся зависимости получены по результатам сложных и длительных субъективных экспериментов. Преобразования, протекающие в ухе от входа акустического сигнала, до проведения спектрального анализа можно попробовать учесть с помощью кривых равной громкости (рис. 2.13):

Рис. 2.13. Кривые равной громкости (КРГ) для различных значений уровней

сигналов.

Таким образом, представляем ухо человека как преобразователь, на входе которого акустический сигнал (акустического давление в дБ относительно порога слышимости), а на выходе уровень измеряемых нами сигналов выраженный в единицах громкости (фонах).

Аналитические зависимости описывающие данные кривые подробно описаны в ГОСТ Р ИСО 226-2009 [30].

Уровень громкости , фон, чистого тона с частотой / с уровнем акустического давления Ьр, дБ, рассчитывают по формуле:

Ьы = 401дВг + 94

(2.2)

где

Вг = (0.4 • 10( 10 9Л -10.4 • 10( 10 Л +0.005135 (2.3)

7у, а^, Ьи приведены в табл. 2.3. Табл. 2.3

Частота / Гц ¿у, дБ , дБ

20 0,532 -31,6 78,5

25 0,506 -27,2 68,7

31,5 0,480 -23,0 59,5

40 0,455 -19,1 51,1

50 0,432 -15,9 44,0

63 0,409 -13,0 37,5

80 0,387 -10,3 31,5

100 0,367 -8,1 26,5

125 0,349 -6,2 22,1

160 0,330 -4,5 17,9

200 0,315 -3,1 14,4

250 0,301 -2,0 11,4

315 0,288 -1,1 8,6

400 0,276 -0,4 6,2

500 0,267 0,0 4,4

630 0,259 0,3 3,0

800 0,253 0,5 2,2

1000 0,250 0,0 2,4

1250 0,246 -2,7 3,5

1600 0,244 -4,1 1,7

2000 0,243 -1,0 -1,3

2500 0,243 1,7 -4,2

3150 0,243 2,5 -6,0

4000 0,242 1,2 -5,4

5000 0,242 -2,1 -1,5

6300 0,245 -7,1 6,0

8000 0,254 -11,2 12,6

10000 0,271 -10,7 13,9

12500 0,301 -3,1 12,3

Измеренные уровни акустического давления (дБ) в частотных полосах («критические полосы»), используя формулы (2.2, 2.3) переводятся в уровни громкости (фоны). Далее полученные результаты используются при расчете значения величины разборчивости речи по методике.

Рассчитаем зависимости словесной разборчивости от отношения сигнал/шум для белого (рис. 2.14) и розового (рис. 2.15) шумов с учетом кривых равной громкости (КРГ) и без него по скорректированной методике для обычной речи.

0.6

0.:

о.з

0.1

- без учета КРГ ----с учетом КРГ

у

/

у /

об

-25

-14

-2Ъ -22

-21

-20

■ 19

■ 13

■ 17

■ 16

■ 15

'4

СЩ дБ

Рис. 2.14. Зависимости словесной разборчивости от отношения сигнал/шум для белого шума с учетом кривых равной громкости и без него

Рис. 2.15. Зависимости словесной разборчивости от отношения сигнал/шум для розового шума с учетом кривых равной громкости и без него

Данные результаты говорят о том, что, при оценке защищенности речевой акустической информации, преобразования сигналов, происходящие

в ухе человека и учитываемые кривыми равной громкости, можно не учитывать. Обоснование полученного результата лежит в специфике проведения данной оценки. Входными параметрами для расчетов являются уровни сигнала и шума в соответствующих частотных полосах, а при расчете отношения сигнал/шум вычисляется разность между данными параметрами.

Однако, факт наличия нелинейных преобразований в человеческом ухе подтверждается многими авторами. Описывается несколько причин появления нелинейных преобразований: искажение формы сигнала в жидкости улитки уха (возникновение вихревых потоков), ослабление громких и усиление тихих сигналов взаимодействием наружных волосковых клеток с базилярной мембраной (И.А. Алдошина [4]), несимметричная упругость барабанной перепонки (С.Н. Ржевкин [66]).

Также фактором указывающим на наличие нелинейных преобразований является появление «субъективных» гармоник. При воздействии на ухо человека синусоидального сигнала с частотой £ вследствие его обработки органами слуха, человек помимо тона с частотой f может воспринимать так же гармоники данного сигнала с частотами 2£ 3f и т.д. Еще одним подтверждением нелинейного характера слуховой системы является эффект появления «комбинационных» тонов. На ухо человека воздействуют два синусоидальных сигнала с частотами £1 и £2, в процессе восприятия четко фиксируется наличие тональных сигналов с частотами П-£2, 2А-£2, 2£1+£2 и т.д. Все это указывает на нелинейных характер

системы, но какова передаточная характеристика данной системы неизвестно. Так же не понятно какой будет выходной сигнал (на выходе уха) при воздействии не тональных сигналов а широкополосных.

2.5 Экспериментальное определение функции распределения формант и зависимости словесной разборчивости от формантной

Экспериментальное определение функции распределения формант и зависимости словесной разборчивости от формантной производится аналогично экспериментам Н.Б. Покровского [61, стр.144], но используются связные тексты, а не слоговые таблицы и отдельно рассматривается эффект форсирования речи.

Эксперимент заключается в следующем: для каждой запись речи диктора при прослушивании аудитором с применением НЧ и ВЧ фильтров определяется такая частота среза фильтров F0, чтобы полученные после фильтрации две записи, включающие частоты от 90 Гц до F0 и от F0 до 10 кГц, обладали одинаковой разборчивостью речи. Полагается, что так как формантная разборчивость (R) обладает свойством аддитивности, то каждая из полученных записей будет обладать формантной разборчивостью R = 0.5. Параллельно с этим определяется и словесная разборчивость (W) полученных записей. Далее каждая из полученных записей подвергается повторно подобному анализу, только теперь каждая из «четвертинок» будет обладать формантной разборчивостью R = 0.25 и т.д. Фильтрация осуществляется с использованием ПО Adobe Audition.

Таким обpазом определяются зависимости словесной разборчивости от формантной W(R), а также функция распределения формант от частоты R(F) для обычной и форсированной речи. Результаты экспериментов приведены на рис. 2.16 и 2.17.

£

о

о щ

н

Бг4

а,

о иг

а,

к н к

Й §

а,

о ©

0.875 0.75 0.625 0.5 0.375 0.25 0.125

1 1 1 -ЕД) по Покровскому -• - ЕД) нормальная речь - - * ЕД) форсированная ре11

А г *

1Ь ✓ / У>

* У *

/ ,/

м * /X

* ** *

---.яц _. —. 4 ^___

100

1x10

Г, Гц

1x10

Рис. 2.16. Функции распределения формант от частоты для обычной речи, форсированной и используемая в общепринятой методике.

к г

и Он

о

о щ

я г

Он

о щ

£ £

1

0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

>

* / .

з + А ' */

г 3 г

з 1 з »

з а з £

J

3 л II

-W(R) по Покровскому ^(Е.) нормальная речь (эксперимент) ----^Щ) форсированная речь (эксперимент) .........

зГ и

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1

Е. (формантная разборчивость)

Рис. 2.17. Зависимости словесной разборчивости от формантной для обычной речи, форсированной и используемая в общепринятой методике.

Полученная функция распределения формант для обычной речи практически совпала с результатами Н.Б. Покровского, а для форсированной существенно отличается и указывает на то, что весовые коэффициенты для случая форсированной речи будут отличаться от используемых для спокойной речи. В табл. 2.4 приведены рассчитанные значения весовых коэффициентов для определенных ранее «критических полос» для форсированной и обычной речи.

Табл. 2.4

Средне геометрическая частота, Гц Весовые Весовые

Начальная частота, Гц Конечная частота, Гц коэффициенты для обычной речи коэффициенты для форсированной речи

90 182 136 0,005 0,023

182 278 230 0,013 0,038

279 381 330 0,023 0,058

382 496 439 0,043 0,071

496 622 559 0,046 0,064

622 762 692 0,052 0,064

762 916 839 0,055 0,06

917 1087 1002 0,055 0,051

1088 1280 1184 0,054 0,053

1281 1503 1392 0,057 0,054

1504 1764 1634 0,075 0,061

1765 2071 1918 0,078 0,056

2072 2434 2253 0,074 0,051

2435 2869 2652 0,069 0,047

2869 3395 3132 0,062 0,045

3395 4033 3714 0,055 0,042

4034 4840 4437 0,057 0,045

4840 5880 5360 0,053 0,045

5880 7218 6549 0,036 0,039

7218 8940 8079 0,022 0,025

8940 11340 10140 0,008 0,008

Как уже было указано, при проведении работ по оценке защищенности речевой информации, диапазон значений величины разборчивости речи, имеющий интерес в задачах ЗИ, составляет от 0.1 до 0.6. По результатам исследований [86], можно сделать вывод о том, что при словесной разборчивости свыше 0.6 возможно составить подробную справку о содержании переговоров, что указывает на тот фак что информация не защищена, при разборчивости же меньше 0.1 чаще всего уже невозможно даже установить предмет разговора и можно сделать вывод о защищенности речевой информации. Исходя из данных результатов, предлагается ограничить зависимости Ж(Я) и линеаризовать их. Упрощенные зависимости представлены на рис. 2.18.

В аналитической форме эти зависимости выражаются следующим образом:

для обычной речи:

Ж (Я) = {

6 • Я, если Я < 0,1; 1, если Я > 0,1.

для форсированной:

Ш (Я) =

7,5 • Я, если Я < 0,08; 1, если Я > 0,08.

(2.4)

(2.5)

к 5* и 0-1

£

и О

т к

а, о иг

Й

А

1

0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

0

У * / / / /

/ * _г_ 1 / I / ГТГ—

1 / |/ у — УДК; для н ор мал ь н о и р еч и - ■ ^(В.) для ф ор с ир ов ан н о й р еч и

0.5

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 В. (формантная разборчивость)

Рис. 2.18. Зависимости словесной разборчивости речи от формантной для обычной и форсированной речи.

2.6 Экспериментальное определение амплитудного состава речи

Еще одним важным фактором является выбор уровня тестового сигнала. Данный уровень возможно определить по известной функции распределения амплитудного состава речи [61, с. 115 (рис. 5.6), с. 152 (рис. 6.17)]. Так в работе [1], на основе анализа данной функции, делается вывод о целесообразности задания определенной вероятности обеспечения требуемого уровня защищенности с последующим нахождением соответствующего этой вероятности интегрального уровня речи. Так, для вероятности 0,95 обеспечения заданного показателя защищенности Ш необходим интегральный уровень тестового сигнала в 85 дБ. Однако, необходимо отметить, что используемые зависимости были получены

Покровским Н.Б. для условий, существенно отличающихся от задач ЗИ: так, расстояние от источника звука до микрофона принималось равным 8 см (в обсуждаемой методике требуется 1 м), за средний уровень речи принято 82 дБ (а не 70 дБ), амплитудное распределение форсированной речи не исследовалось вообще.

Таким образом, для корректировки методики [44] как для случая спокойной (нормальной) речи, так и при возникновении эффекта форсирования, необходимо определить амплитудный состав речи, по которому можно будет сделать вывод выборе достаточного уровня тестового сигнала.

Амплитудный состав речи анализировался аналогично эксперименту, приведенному у Покровского Н.Б. [61, с. 148]. Для исследования были созданы записи 8 дикторов (4 мужчины и 4 женщины) с обычной и форсированной речью. Запись производилась с использованием шумомера 7БТ 110 и микрофона ВС501 с частотой дискретизации 50 кГц. Длительность каждой из записей составляла 600 с. Из-за большого количества отсчетов обработка производилась частями по 100 с.

Эксперимент заключается в следующем:

• по полученным отсчетам находятся среднеквадратичные значения на интервалах времени по 0,125 с;

• динамический диапазон полученных значений разбивается на коридоры шириной по 1дБ (относительно порога слышимости 20 мкПа);

• рассчитывается количество попаданий среднеквадратичных значений в каждый из коридоров;

• строятся гистограммы (рис. 2.19, 2.20) и функции распределения (рис.

2.20).

Рис. 2.19. Гистограммы распределения нормальной и форсированной

речи дикторов женщин

Рис. 2.20. Гистограммы распределения нормальной и форсированной

речи дикторов мужчин Внешний вид гистограмм позволяет предположить модель амплитудного состава речи на фоне естественного шума в виде смеси двух (близких к гауссовским) законов распределения.

Механизм, порождающий такую смесь, по-видимому, выглядит так. В некоторых интервалах усреднения (Лt = 0,125с) речь диктора не звучала, и долю таких пауз, где слышен только шумовой фон, обозначим а. Остальная

доля измерений (1 — а) это аддитивная сумма речевого и шумового сигналов

Таким образом, имеем гипотезу, что плотность состава речи равна:

f(x, т1, т2, о!, а2, а) = (1 — а)ф(х, т±, а±) + ац>(х, т2, а2), (2.6)

где у - гауссовская плотность, (тг, а±) и (т2, а2) - параметры закона речи и шума соответственно, а - доля шумовой составляющей.

На рис. 2.21 показаны гистограмма амплитудного состава нормальной речи и аппроксимирующая ее плотность вида (2.6), где параметры т2 = 57,70 дБ и о2 = 1,28 дБ были предварительно оценены по выборке шумовой составляющей. Параметры т± = 67,02 дБ, а± = 4,10 дБ и а = 0,1 подбирались по минимуму критерию х2 до достижения значимости, превышающей 0,05 и не позволяющей отклонить гипотезу (2.6). Таким образом, паузы в этом речевом сигнале составляют примерно 10%.

Рис.2.21. Гистограмма и теоретическая плотность (смесь)

нормальной речи

В литературе [2, 54] описаны различные методы оценивания параметров смеси распределений применительно к задачам классификации. В основном это модификации метода моментов и метода максимального

правдоподобия. Наиболее эффективным представляется так называемый ЕМ-алгоритм.

Оценка математического ожидания уровня смеси определяется по:

т = (1 — а)тг + ат2 (2.7)

и для нормальной речи составляет приблизительно 66,09дБ.

Однако эти вопросы выходят за рамки настоящей работы. Для задачи выбора уровней тестовых сигналов достаточно сопоставить эмпирическую функцию распределения и теоретическую, найденную по:

[(х, т±, т2, а±, а2, а) = (1 — а)Ф(х, т1, аг) + аФ(х, т2, а2), (2.8)

где Ф - функция Лапласа. Варьируя параметрами а, тг, а±, добиваемся практического совпадения эмпирической и теоретической квантилей уровня 0,95. На рис. 2.22 хорошо видно данное совпадение.

1,00 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00

-

л

/

/

у?

*

54 56 58 60 62 64 66

70 72 74 76 78

Акустическое давление, дБ

Рис. 2.22. Эмпирическая и теоретическая функции распределения

нормальной речи

Для рассмотренных четырех видов речевых сигналов (мужской спокойный, женский спокойный, мужской форсированный, женский форсированный) на рис. 2.23 сведены результаты экспериментов в виде зависимостей вероятности превышения тестового сигнала от его уровня.

1,00 0,95 0,90 0,85 0,80 0,75 0,70 0,65 й 0,60 8 0,55 в 0,50 <о 0,45 « 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00

Акустическое давление, дБ

^^^^ Форсированный Ж • Спокойный Ж — — Форсированный М — • Спокойный М

Рис. 2.23. Амплитудные составы спокойной и форсированной речи дикторов (мужчин и женщин) Исходя из результатов эксперимента можно сделать выводы, что для обеспечения вероятности 0,95 необходимо выбирать уровни тестового акустического сигнала 75дБ для обычной речи и 85дБ для форсированной. При этом усредненные результаты по мужским и женским записям существенно не различаются.

Математическое ожидание уровня нормальной речи составляет приблизительно 66 дБ.

Полученные результаты необходимо учесть при корректировки методики оценки защищенности речевой информации.

2.7 Определение зависимости коэффициента восприятия от уровня ощущений для форсированной речи

Известно, что зависимость Рф) существенно изменяется при воздействии на слушателя сильного мешающего шума, либо при использовании средств активной защиты, что и происходит при форсировании речи.

На рис. 2.24 приведена зависимость изменения зависимости Р^) от уровня шума [61, стр. 214]:

Рис. 2.24. Зависимость изменения зависимости Рф) от уровня шума С увеличением уровня шума кривая становится более пологой, что наводит на мысли о возможной линеаризации и увеличении угла наклона данной зависимости.

Предлагаемая зависимость в сравнении с используемой в общепринятой методике приведена на рис. 2.25.

к is

а

я

Q. К а О И (К

0J

К Сг is

П)

о ^

Рч

1

0.5 0.S 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

t

t

t

1 f

1

» 1

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.