Цифровая обработка изображений динамических сонограмм для нейтрализации спектральных искажений речевой информации тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Алюшин, Виктор Михайлович

  • Алюшин, Виктор Михайлович
  • кандидат науккандидат наук
  • 2014, Москва
  • Специальность ВАК РФ05.13.01
  • Количество страниц 217
Алюшин, Виктор Михайлович. Цифровая обработка изображений динамических сонограмм для нейтрализации спектральных искажений речевой информации: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Москва. 2014. 217 с.

Оглавление диссертации кандидат наук Алюшин, Виктор Михайлович

Оглавление

Введение

1 Анализ существующих технологий восстановления искаженных речевых сигналов

1.1 Речевая информация (РИ) и способы ее оценивания

1.1.1 Разборчивость и понятность как основные показатели целостности смыслового содержания РИ

1.1.2 Особенности процесса речеобразования и слухового восприятия речи

1.1.3 Связь спектральных описаний речевого сигнала с его разборчивостью и фонетической функцией

1.2 Причины и виды спектральных искажений речевой информации

1.2.1 Искажения, обусловленные акустической средой распространения звуковой волны

1.2.2 Искажения речевых сообщений в каналах голосовой связи

1.2.3 Искажения речепреобразующих процессов и устройств

1.2.4 Спектральные искажения без потери исходной РИ

1.2.5 Спектральные искажения с частичной потерей РИ

1.3 Модели нарушителя и угроз информации в выделенных помещениях

1.4 Анализ методов и средств нейтрализации речевых искажений

1.4.1 Методы полосовой фильтрации и клиппирования

1.4.2 Методы адаптивного подавления помех

1.4.3 Методы коррекции спектра РС

1.4.4 Методы сглаживания спектра РС

1.4.5 Технология «звук-изображение-звук»

1.4.6 Сравнительная характеристика наиболее распространенных на

российском рынке средств обработки речи

1.5 Постановка задачи и требования к программно-техническим средствам с учетом особенностей современных многоядерных процессоров

Выводы по главе 1

2 Исследование возможностей образного анализа-синтеза речи к реконструкции и восстановлению искаженных аудиоданных

2.1 Уточнение аналитических описаний речевого сигнала

2.1.1 Анализ традиционных описаний речевого сигнала на вокализованных участках

2.1.2 Уточненное Гауссовское описание речевых вокализмов

2.2 Кратковременный Фурье-анализ и графическое представление речевых сигналов в частотно-временной области

2.2.1 Обоснование выбора шага частотно-временной сетки

2.2.2 Обоснование выбора оконной функции

2.3 Совершенствование методов восстановления речеподобных сигналов по изображениям узкополосных спектрограмм

2.3.1 Общие подходы к синтезу речеподобных сигналов по изображениям спектрограмм

2.3.2. Синтез речи с использованием оригинальной фазограммы

2.3.3 Синтез речи с использованием фазограммы с искусственной протяжкой фазы

2.3.4 Сравнение различных видов синтезов

2.4.Тестирование алгоритмов синтеза звука для случая произвольного изображения

Выводы по главе 2

3 Разработка и тестирование графического инструментария для восстановления искаженной речи на основе образного анализа-синтеза сонограмм

3.1 Масштабирование и сдвиг изображений сонограмм

3.1.1 Билинейная фильтрация

3.1.2 Интерполяция с помощью ДПФ

3.2 Расслоение, "склейка" и нелинейная фильтрация частотно-временных описаний

3.2.1 Инструменты "Ластик" и "Антиластик"

3.2.2 «Коридор визуализации»

3.2.3 Обработка мультипликативно искаженных спектральных описаний с целью восстановления фонетической функции речи

3.2.4 Медианная фильтрация

3.2.5 Выделение областей спектрограммы

3.2.6 Удаление мешающих аддитивных шумов и квазигармонических сигналов

3.3 Восстановление гармонической и формантной структур искаженных речевых сообщений

3.3.1 Метод восстановления гармонической структуры искаженного речевого сигнала на фоне шумов

3.3.2 Восстановление гармонической структуры РС с потерей информации в частотных полосах

3.3.3 Протяжка по времени линий гармоник основного тона

3.3.4 Восстановление формантной структуры искаженного речевого сигнала при наличии базы данных голоса диктора

3.3.5 Особенности комплексного использования методов восстановления

4 Экспериментальные исследования предложенных методов нейтрализации спектральных искажений речевой информации в системах голосовой связи

4.1 Описание состава программно-технических средств, используемых в экспериментальном стенде по восстановлению речевой разборчивости

4.1.1 Структура модулей разработанного программного обеспечения

4.1.2 Инструменты и средства редактирования изображений спектрограмм, реализованные в ПО "Sound Tool"

4.1.3. Описание графического интерфейса разработанного программного обеспечения

4.2 Описание экспериментального стенда и условий проведения экспериментов по восстановлению искаженной речевой информации

4.3 Обобщение результатов проведенных экспериментов по нейтрализации спектральных искажений речевого сигнала

4.4 Применения полученных результатов образного анализа сонограмм в задачах защиты и обработки речевой информации

Выводы по главе 4

Заключение

Список терминов, условных обозначений и сокращений

Список литературы

Приложение А. Описания и точность оконных функций

Приложение Б. Исходные коды библиотеки алгоритмов

гармонической и формантной структур

126

Выводы по главе

127

Приложение В. Примеры применения программного комплекса "Sound Tool" для решения различных стеганографических задач и задач обработки звуковых сигналов

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Цифровая обработка изображений динамических сонограмм для нейтрализации спектральных искажений речевой информации»

Введение

Актуальность темы диссертационного исследования.

Речевые сообщения (PC) вместе с видеоданными являются наиболее широко используемым контентом информационного обмена (ИО), что обуславливает практическую необходимость создания эффективных методов и программно-технических средств качественной передачи речевой информации (РИ). Качество речевой передачи также важно для речепреобразующих устройств, работающих в защищенном от НСД режиме, предусматривающем намеренное искажение-восстановление её смыслового содержания и оценку эффективности такой защиты. Кроме того, при передаче, обработке и записи речи окружающая акустическая обстановка и сама среда распространения PC довольно часто являются неблагоприятными, что приводит к изменению главной характеристики качества передачи РИ — речевой разборчивости (РР), ее снижению и затруднению в понимании PC. В дополнение к этому, при передаче PC по линиям связи низкого качества или низкой пропускной способности разборчивость также может быть снижена за счет ограничений алгоритмов аудиокодирования и воздействия канальных помех. В связи с этим, в системах защиты и обработки РИ актуальной является задача восстановления смыслового содержания (семантики) преднамеренно или непреднамеренно искаженных PC с целью улучшения понятности устной речи, иногда даже в ущерб другим качественным характеристикам: натуральности, естественности звучания и комфортности восприятия.

Анализ существующих методов и средств восстановления частично разрушенной, искаженной речевой информации показал, что все они, так или иначе, влияют на трансформацию спектральных характеристик речевого сигнала, прежде всего изменяя значения амплитудного спектра. С его огибающей связана и фонетическая функция (ФФ), согласно работам A.A. Пирогова [99] и других ученых, определяющая понятность устной речи, ее смысловое содержание (семантику), которое в конечном итоге можно представить в текстовом виде.

Разработке и исследованию различных методов цифровой обработки и защиты речевой информации, определению и повышению разборчивости PC посвящены работы ведущих отечественных и зарубежных ученых: Пирогова

A.A., Калинцева Ю.К., Сапожкова М.А., Женило В.Р., Хорева A.A., Карга-шина B.JL, Чудновского JI.C., Шалимова И.А., Малинина Ю.И., Соболева

B.М., Фанта Г., Фланагана Дж., Рабинера Р., Шафера Р., Продеуса А.Н. и др.

Опираясь на результаты этих работ, можно построить единую методическую и алгоритмическую базу, позволяющую бороться с наиболее распространенными видами помех и искажений даже при их значительном воздействии на спектральные характеристики PC. Современные многоядерные процессоры значительно расширяют возможности цифровой обработки сигналов, основывающейся, как правило, на кратковременном спектральном Фурье-анализе (КФА) [100], который может быть принят за основу построения базовых методов коррекции спектральных характеристик искаженного PC [59], а также фильтрации, удаления и/или компенсации (вместе нейтрализации) сопутствующих ему шумов и помех.

Посредством КФА реализуется оригинальный подход к обработке акустических сигналов, базирующийся на технологии преобразования информации "звук-изображение-звук" (далее - технология образного анализа-синтеза) [21, 60-65, 80]. Первая часть преобразования "звук-изображение", приводящая к построению и визуализации узкополосных динамических сонограмм (ДС), известная более полувека, довольно хорошо изучена, но требует уточнений. Однако вторая часть - "произвольное изображение-звук" - в открытых источниках появилась относительно недавно и её возможности до конца ещё не исследованы.

В рамках предлагаемого подхода нейтрализация воздействия на РИ шумов и помех, воссоздание разрушенных или утерянных фрагментов речи, могут быть реализованы посредством обработки (реконструкции и восстановления) изображений искаженных ДС с последующим синтезом по ним нового восстановленного PC. Обратный переход от нового изображения к рече-

подобному сигналу (РПС) возможен либо с помощью обратного преобразования Фурье обновленных спектральных срезов на изображениях ДС, либо непосредственным расчетом по корректно рассчитанным параметрам подобранных подходящих частотно-временных описаний самого РС.

Перспективность использования указанного подхода для восстановления семантики искаженных РС обусловлена также активным развитием технологий анализа и обработки видеоданных в повсеместно развивающихся системах видеоконференций, трансляций, наблюдения, обработки и регистрации. Используя результаты работ Претта У., Гоулда Б., Ярославского Л.П., Грибунина В.Г., Брукштейна А.М., Хольта Р.Дж. и других известных авторов в сфере цифровой обработки изображений и компьютерной стеганографии, можно использовать наработанный потенциал видеоанализа и обработки применительно к графическим образам РС, в качестве которых берутся изображения ДС, для трансформации и восстановления спектральной огибающей при нейтрализации различных типов речевых искажений.

Таким образом, в связи с вышеизложенным, актуальным является совершенствование технологии преобразования информации "звук-изображение-звук", использование существующих и разработка перспективных решений к видеоанализу и обработке для создания новых методов, алгоритмов и программно-технических средств нейтрализации разнообразных семантических искажений РИ.

Объектом исследования являются системы речевой обработки, связанные с обнаружением и нейтрализацией спектральных искажений речевой информации.

Предметом исследования являются модели речевых сигналов, методы и алгоритмы обработки изображений узкополосных динамических соно-грамм, пригодные для восстановления искаженной речевой информации.

Целью диссертационного исследования является разработка методов и алгоритмов реконструкции и восстановления изображений искаженных узкополосных динамических сонограмм с последующим переходом к волновой

форме нового речеподобного сигнала и их реализация в программно-технических средствах для нейтрализации семантических искажений речевой информации.

Задачи исследования:

1. Исследование свойств речеобразования и слухового восприятия, анализ существующих описаний речевых сигналов для обоснования выбора способов графического представления ключевых для понимания параметров РС на изображениях ДС.

2. Исследование возможности применения методов обработки изображений для нейтрализации спектральных помех и искажений семантики речевой информации с учетом требований к реализации в специальных технических средствах.

3. Совершенствование технологии преобразования "звук-изображение-звук" в части восстановления (синтеза) речеподобных сигналов по изображениям узкополосных спектрограмм.

4. Разработка и исследование специализированных методов и алгоритмов восстановления гармонической и формантной структур искаженных речевых сигналов.

5. Разработка и исследование универсальных методов обработки спектральных характеристик РС на изображениях динамических сонограмм с оценкой возможности их комплексного применения.

6. Реализация предложенных методов и алгоритмов в едином программном комплексе, их экспериментальное тестирование, а также разработка интерактивного графического интерфейса и интерфейса взаимодействия с внешними распространенными графическими редакторами.

7. Оценка эффективности предложенных программно-технических решений.

Методы исследования

В работе использовались методы системного анализа, цифровой обработки сигналов и изображений, математического и компьютерного модели-

рования, спектрального и корреляционного анализа, а также методы оценки защищенности речевой информации.

Общей методологической основой проведения, исследований является системный подход.

Обоснованность и достоверность результатов диссертации Обоснованность результатов диссертации определяется корректным применением используемых методов исследования. Достоверность основных положений диссертационного исследования обеспечивается корректностью применения математического аппарата, доказанностью выводов, совпадением теоретических результатов с экспериментальными данными, а также успешной практической реализацией результатов в образовательной деятельности, апробацией на научно-технических конференциях, семинарах и выставках, внедрением результатов исследований в ряд практических разработок. Основные положения, выносимые на защиту:

— уточненное описание речевого сигнала, подходящее для описания вокализованных и невокализованных участков речи, которое вместе с обоснованно выбранной оконной функцией позволяет корректно рассчитывать изображения ДС и интерпретировать результаты КФА на изображениях ДС;

— усовершенствованный метод синтеза звуковых сообщений по изображениям спектрограмм, позволяющий генерировать звук РПС без оригинальных фазовых значений или с частичным использованием оригинальной фазы в зависимости от поставленной задачи и параметров звуковой обработки;

- алгоритм автоматического восстановления гармонической структуры вокализованных участков искаженного звукового сигнала по вершинам парабол треков гармоник РС на спектральных развертках, позволяющий повысить точность нахождения частоты основного тона в условиях ограниченных вычислительных ресурсов;

- набор реализованных в ПО вычислительных процедур и алгоритмов обработки изображений динамических спектрограмм, позволяющих эффективно нейтрализовать спектральные искажения РС различных видов;

- единый программный комплекс "Sound Tool", реализующий на различных аппаратных платформах разработанные алгоритмы, использующий технологию параллельного программирования для ускорения обработки изображений спектрограмм.

Научная новизна:

- предложен новый подход к восстановлению семантики и повышению РР искаженной РИ, основанный на обработке изображений спектральных описаний PC;

- показана возможность использования активно развивающегося научно-методического аппарата цифровой обработки изображений для анализа, обработки и защиты речевой информации;

- реализован алгоритм нахождения частоты основного тона (ЧОТ) вокализованных участков речи по экстремумам аппроксимирующего многочлена спектральных разверток, позволяющий, в отличие от существующих методов, находить положения кратных основному тону гармоник искаженного помехами PC даже при их частичном отсутствии в оригинальном сигнале при небольших вычислительных затратах;

- предложен впервые способ наложения формант на восстановленную гармоническую структуру с использованием априорных сведений из базы данных голоса конкретного диктора;

- усовершенствован алгоритм синтеза нового понятного и разборчивого речеподобного сигнала (РПС) по восстановленным и реконструированным изображениям узкополосных ДС, интерпретируемых в качестве его спектральных характеристик.

Практическая значимость

Разработанные методические и технические средства позволяют создавать новое поколение высокоэффективных программно-аппаратных комплексов для решения следующих задач:

- нейтрализации искажений и помех в многоканальных системах приема, регистрации PC, а также в мобильных защищенных устройствах передачи РИ;

- оценки защищённости РИ, произносимой в выделенных помещениях конфиденциальных переговоров или передаваемой по системам защищенной голосовой связи (уточненные критерии защищенности выделенных помещений приведены в таблице 4.3);

- дистанционного мониторинга текущего психоэмоционального состояния оператора управления особо важными, либо опасными объектами по уровню микротремора в голосе в интересах ГК «Росатом», МО и других служб и ведомств;

- поиска людей под завалами и в труднодоступных местах в интересах МЧС и МО на основе распознавания PC при высоком уровне шумовых помех.

Предложенный для нейтрализации помех и искажений РИ подход, реализуемый на основе преобразования информации «звук-изображение-звук», можно рассматривать в качестве некоторого нового базиса для создания современных методов и методик оценки защищенности речевой информации в выделенных помещениях и каналах голосовой связи, а также повышения эффективности систем обеспечения информационной безопасности РИ на объектах защиты. С учетом возможностей злоумышленника по использованию цифровой обработки сигналов были уточнены критерии эффективности защиты выделенных помещений (таблица 4.3).

Список публикаций

По основным положениям диссертационной работы опубликовано 8 печатных работ [26-33], из них - 6 работ [28-33] в изданиях, рекомендованных ВАК РФ, из них 1 работа [32] - в журнале, представленном в базе цитирования Scopus.

Апробация работы

Основные результаты диссертационной работы докладывались на следующих конференциях:

- Всероссийской конференции по защите информации RuCTF-2013, Екатеринбург, 19-22 апреля 2013 г.;

- 1Х-й Международной научно-практической конференции «Безопасность ядерной энергетики», Волгодонск, 23-24 мая 2013 г.;

- Шестнадцатой Международной научно-практической конференции "Фундаментальные и прикладные исследования, разработка и применение высоких технологий в промышленности и экономике", Санкт-Петербург, 5-6 декабря 2013 г.

Результаты диссертационного исследования демонстрировались в составе инновационного экспоната «Автоматизированный акустический комплекс определения концентрации различных газов «Матрица», отмеченного дипломом на Международном салоне «Комплексная безопасность - 2011», Москва, май 2011 г.

Результаты диссертационного исследования демонстрировались в составе модернизированного экспоната на основе акустических технологий «Автоматизированный комплекс для идентификации состава и определения концентрации различных газов, взвесей и аэрозолей «Матрица-Ж)» на V Международном салоне «Комплексная безопасность - 2012», Москва, 22-25 мая 2012 г. Разработка отмечена дипломом Международного салона в номинации «Лучшие комплексные решения в области экологической безопасности», а также золотой медалью «Гарантия качества и безопасности» Международного конкурса «Национальная безопасность».

Внедрение результатов работы

- Результаты диссертационного исследования учтены при разработке модулей ЕМР - 25 (маскираторов речи для цифровых радиостанций), используемых в радиосетях ОВД.

- Результаты работы в виде ПО нейтрализации искажений РР применены при разработке специализированного многоканального программно-аппаратного комплекса повышения речевой разборчивости "Палитра" в интересах заказчиков из силовых ведомств.

- Теоретические и практические результаты, полученные в ходе выполнения диссертационной работы, использованы в учебном процессе НИЯУ МИФИ при разработке лабораторного практикума по дисциплине "Методы и средства контроля эффективности защиты информации от утечки по техническим каналам".

Получены соответствующие акты о внедрении результатов диссертационной работы из силовых структур и НИЯУ МИФИ.

Структура и объем диссертационного исследования.

Диссертационное исследование содержит 217 страниц машинописного текста и состоит из введения, четырех разделов, заключения, списка используемых источников, приложений. Основная часть диссертации содержит 179 страниц текста, 93 рисунка и 25 таблиц. Список источников включает 124 наименования.

На рисунке 1 представлена структура диссертационного исследования.

Анализ состояния вопроса обеспечения семантической помехоустойчивости речевой информации

Глава 1

Виды спектральных искажений речевой информации

Аддитивные помехи

Мультипликативные помехи

Иные виды помех

Глава 2

Исследование возможностей образного анализа-синтеза речи к реконструкции и восстановлению семантики искаженных аудиоданных

Методы реконструкции искаженных сонограмм на основе образного анализа-синтеза речи

Глава 3

Реконструкция гармонической структуры и ее протяжка вовремени

С пециализированные методы обработки спектрограмм

Глава 4

Экспериментальные исследования методов нейтрализации спектральных искажений речевой информации в системах голосовой связи

Заключение

Итоги выполненного диссертационного исследования

Перспективы дальнейшей разработки темы

Рисунок 1 - Структура диссертационного исследования

В главе 1 рассматриваются причины воздействия искажающих факторов на семантическую составляющую РИ. В частности, рассматриваются искажения, обусловленные акустической средой распространения звуковой волны, искажения в каналах голосовой связи, а также искажения речепреобра-зующих процессов и устройств.

Особое внимание уделяется анализу видов спектральных искажений РИ, среди которых выделены спектральные искажения без потери исходной РИ и спектральные искажения с частичной потерей РИ. В рамках анализа первого подхода подробно рассматриваются аддитивные помехи, мультипликативные помехи, а также иные виды помех.

Представлен анализ существующих подходов к устранению речевых искажений и дана постановка задачи диссертационного исследования.

В главе 2 диссертационного исследования исследуются возможности графического представления РС во временной и частотной областях. Анализируются возможности образного анализа изображений спектрограмм и фа-зограмм применительно к восстановлению искаженной РИ. Предложены направления совершенствования методов синтеза речеподобных сигналов по изображениям узкополосных спектрограмм.

В рамках уточнения аналитических описаний для РС представлен анализ традиционных моделей РС на вокализованных участках, даны уточненные гильбертовские описания речевых вокализмов, рассмотрено представление акустического сигнала как суперпозиции узкополосных сигналов его составляющих.

Глава 3 диссертационного исследования посвящается описанию разработанных методов реконструкции искаженных сонограмм на основе образного анализа-синтеза речи. В этой связи рассматриваются метод восстановления разборчивости через изменение и обработку фонетической функции, а также подход к восстановлению искаженной РИ посредством цифровой обработки изображений узкополосных динамических сонограмм.

Для рассматриваемого метода представлен алгоритм обработки искаженных спектральных описаний с целью восстановления фонетической функции речи. Анализируются подходы к удалению мешающих аддитивных шумов и квазигармонических сигналов.

В рамках реализации предлагаемого подхода рассматриваются: метод восстановления гармонической структуры искаженного PC; метод восстановления формантной структуры искаженного PC при наличии базы данных голоса диктора; перспективы комплексного использования методов восстановления гармонической и формантной структур.

Глава 4 посвящается экспериментальному исследованию разработанных методов нейтрализации спектральных искажений РИ в системах голосовой связи. В этой связи представлены описания разработанного специализированного программного комплекса "Sound Tool", структуры основных базовых и дополнительных программных модулей, инструментов и средств редактирования изображений спектрограмм, а также характеристик используемого оборудования и условий проведения эксперимента.

Показывается возможность реализации интерфейса между разработанным ПО и стандартными графическими редакторами через импорт и экспорт изображений спектрограмм с использованием современных форматов (bmp, jpg, png, gif, tiff и др.).

Показываются результаты применения разработанных алгоритмов обработки изображений спектрограмм для нейтрализации помех и искажений различного характера.

Представляется обобщение результатов проведенных экспериментов по восстановлению речевой разборчивости, сформулированы направления дальнейших исследований в задачах по реконструкции и восстановлению искаженной РИ.

В заключении формулируются основные результаты диссертационной работы.

1 Анализ существующих технологий восстановления искаженных

речевых сигналов

В главе 1 рассматриваются вопросы информативной составляющей РС, показана роль семантической составляющей РС, проанализированы причины воздействия искажающих факторов на семантическую составляющую РИ, дана классификация спектральных искажений речевой информации (РИ), представлен анализ существующих подходов к борьбе с речевыми искажениями. На основе проведенного анализа современного уровня разработок в области "шумоочистки" РС в заключении данного раздела сформулированы актуальные научные и практические задачи диссертационного исследования.

1.1 Речевая информация (РИ) и способы ее оценивания

С физической точки зрения РС представляет собой сложный амплитудно- и частотно-модулированный акустический сигнал [9, 10, 11]. Под звуковым частотным диапазоном обычно рассматривается диапазон частот 20 Гц — 20 кГц. Основная часть спектра РС находится в диапазоне 70 Гц — 7 кГц. Более 95% смысловой информации РС находится в еще более узком частотном диапазоне - 200 Гц - 5 кГц. РС в более низких, а также в более высоких частотных диапазонах несет информацию об эмоциях и личности говорящего и в определенной степени улучшает узнаваемость и РР.

В работе [66] показано, что речь может быть охарактеризована несколькими основными группами параметров (рисунок 1.1):

- семантическая или смысловая сторона речи - характеризует смысл тех понятий, которые передаются при ее помощи;

- фонетические характеристики речи - данные, характеризующие речь с точки зрения ее звукового состава. Основной фонетической характери-

стикой РС является частота повторения в нем различных звуков и их сочетаний;

— физические характеристики - величины и зависимости, характеризующие речь как акустический сигнал, например, громкость РС;

— индивидуальные характеристики речи, присущие каждому человеку.

Рисунок 1.1— Основные характеристики речи

В данной работе первостепенное значение уделяется семантическому (смысловому) содержанию речи, при этом при использовании различных методов обработки речи индивидуальные признаки диктора могут искажаться.

РС можно представить в виде суммы узкополосных процессов (гармонических составляющих), амплитуды которых уменьшаются с ростом частоты (рисунок 1.2). ЧОТ (первой гармоники) этого ряда характеризует собой тип голоса говорящего: бас, баритон, тенор, альт, контральто, сопрано.

Спектрограмма, согласно работам [100, 109, 110], считается одним из наиболее информативных и визуально понятных человеку способом представления аудиосигнала.

Для низких мужских голосов ЧОТ может составлять величину порядка 60-80 Гц, а для высоких женских голосов - порядка 450-500 Гц [100].

Тек.

M Pos: 200.0ms

SAVE/REC Tek. Action

tgj Ready

РОК 1.230kHz SAVE/REC Action

CHI 20.0mV CH2 2.00V M 10.0ms CH3 5.00V CH4 2.00mVEW 11-Oct-13 21:38

Save TEK0001.BMP

'cHÎ l'"L-11.6mV CHI lO.OdB 250HZ C5.00kS/s>

<10Hz Current Folder Is A: \

File Format

шдтз

About Saving Images

Select Folder

Save TEK0003.BMP

100 200 300 400 500 Т, мкс

Рисунок 1.2 - Осциллограмма (а), мгновенный спектр (б) и спектрограмма (в) РС

В таблице 1.1 представлены средние значения для ЧОТ для различных типов голосов [110].

Таблица 1.1— Характеристики различных типов голосов

Характеристика голоса Тип голоса

Мужской голос Женский голос Детский голос

Среднее значение ЧОТ 132 Гц 223 Гц 264 Гц

Согласно теории речеобразования [119, 124], РС содержит либо усиленные благодаря резонансным свойствам речеобразующего тракта человека гармонические составляющие, либо, наоборот, ослабленные. Эти усиленные области частот, называемые формантами [100], в основном формируют звучание того или иного звука.

В общем случае оценить качество РС достаточно сложно. Сложность заключается в том, что в РС отражаются не только индивидуальные анатомические, физиологические и нейрофизиологические характеристики человека,

но и психологические, эмоциональные, интеллектуальные и иные особенности, определяющие конкретную личность и затрудняющие оценку непосредственно качества РС.

Анализируя РИ на практике, обычно выделяют так называемые признаки речи, которые характеризуют различные информационные аспекты РС, например, такие как возрастные, эмоциональные и другие [119].

Так, при решении задачи маскирования РС в защищенных системах связи предполагаются два конкурирующих подхода:

- разработка высокозащищенных систем передачи РС за счет гарантированного снижения разборчивости до уровней, не позволяющих осуществить ее восстановление в случае перехвата при НСД [21, 50, 59, 60, 68, 84, 85, 93, 106];

- разработка специализированных систем перехвата РС из защищенных каналов связи и управления потенциального противника, способных осуществить восстановление ее смысловой структуры [62, 69, 70, 71, 77].

Необходимо отметить, что в случае НСД к закрытому каналу передачи РС существует вероятность восстановления ее информативного содержания при использовании современных вычислительных и методических средств.

Гарантировать защищенность канала передачи РС становится возможным за счет достоверного контроля и управления РР передаваемой РИ, что позволяет выполнить требования к остаточной РР, например, для ВП.

Все функциональные элементы, принимающие участие в обработке РС, вносят свой вклад в итоговый уровень шума РС. В силу вышесказанного, разборчивость РС становится одним из основных показателей качества РИ. Применительно к рассматриваемой задаче достоверная оценка разборчивости РС является центральным критерием при определении:

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Алюшин, Виктор Михайлович, 2014 год

Список литературы

1. 134-конгресс AES - научные результаты [Электронный ресурс] // ProSound.iXBT.com. - 2013. - Режим доступа:

http ://prosound. ixbt.com/events/aes 13 4. shtml.

2. ANSI S3.5-1997, American National Standard Methods for Calculation of the Speech Intelligibility Index - American National Standards Institute, New York. - 1997.

3. BaltCTF Quals 2013 Writeup. Look Carefully (300, stegano) [Электронный ресурс] // RDot. - Режим доступа:

https ://rdot.org/forum/showthread .php?t=2 718.

4. Belyaev A. Next Generation DSP Multi-Core Processor with Space Wire links as the Development of the 'MCFlight' Chipset for the Onboard Payload Data Processing Applications / A. Belyaev, T. Solokhina, J. Petrichkovich, A. Glushkov, Y. Alexandrov, I. Alekseev, Y. Sheynin // Proceedings of the 3rd International Space Wire Conference. St. Petersburg. - 2010. - P. 313-318.

5. Boll S.F. Suppression of Acoustic Noise in Speech Using Spectral Subtraction // IEE Trans. Acoust., Speech, Signal Processing. - 1979. - Vol. 27. P. 113-120.

6. Collard J. A. Theoretical Study of the Articulation and Intelligibility of a Telephone Circuit / J.A. Collard // Electrical Communication. - 1929. - Vol. 7. -P. 168.

7. Ephraim Y. A Brief Survey of Speech Enhancement / Y. Ephraim, H. Lev-Ari, W.J.J. Roberts // The Electronic Handbook, CRC Press. - 2005.

8. Ephraim Y. Speech Enhancement Using a Minimum Mean Square Error Short Time Spectral Amplitude Estimator / Y. Ephraim, D. Malah // IEEE Trans. Acoust., Speech, Signal Processing. - 1984. - Vol. 32. - P. 1109-1121.

9. Flanagan J. Computer Studies on Parametric Coding of Speech Spectra / J. Flanagan , S. Christensen // J. Acoust. Soc. Am. - 1980. - Vol. 68(2). - P. 420.

10. Flanagan J. Speech Analysis, Synthesis and Perception / J. Flanagan // Springer-Verlag. - 1972.

11. Flanagan J. Phase Vocoder / J. Flanagan, Golden // Bell Tech. J.. - 1966. -Vol. 45. - P. 1493.

12. Fletcher H. Perception of Speech and its Relation to Telephony / H. Fletcher, F. Gait // J. Acoust. Soc. Am. - 1950. - Vol.22. - № 2.

13. Hackquest #5 [Электронный ресурс] // SUMIT Quest. - Режим доступа: http://hackq.ru/.

14. Jacob K.D. Correlation of Speech Intelligibility Tests in Reverberant Rooms with Tree Predictive Algorithmes. / K.D. Jacob // J. Audio Eng. Soc. - 1989. -Vol. 37,- P. 1019-1030.

15. Keele D.B. Evaluation of Room Speech Transmission Index and Modulation Transfer Function by the Use of Time Delay Spectrometry / D.B. Keele // Techron, Div. Crown International, Inc., Elkhart, Indiana, 46517, USA.

16. Kryter K.D. Methods for the Calculation and Use of the Articulation Index / K.D. Kryter // J. Acoust. Soc. Am. - 1962. - Vol. 34. - P. 1689-1697.

17. Machine Learning with Quantum Algorithms [Электронный ресурс] // Research Blog. - The Latest News from Research at Google. - 2009. - Режим доступа: http://googleresearch.blogspot.ru/2009/12/machine-learning-with-quantum.html.

18. RuCTF Quals 2013 Writeup. Stegano 300 [Электронный ресурс] // h34dump. - Режим доступа: http://h34dump.com/2013/03/ructf-quals-2013-stegano-300/.

19. Thomas I. Processing of Speech for Added Intelligibility in High Ambient Noise / I. Thomas, R. Niedeijohn. // 34 съезд Общества инженеров-акустиков, 1968.

20. Vorobiov V.I. Inter Component Phase Processing of Speech Signals for Their Recognition and Identification of Announcers / V.I. Vorobiov // XVIII Session of the Russian Acoustical Society, Taganrog, September 11-15, 2006.

21. Абрамов Ю.В. Опыт практических работ по виброакустической защите выделенных помещений от утечки речевой информации /Ю.В. Абрамов, М.В. Калиныченко, B.JI. Каргашин // Научно-практическая конференция «Ключевые проблемы банковской безопасности» Третьего московского международного форума «Технология безопасности - 98». — Москва, 4-7 февраля 1998: Сборник докладов. М.: Манеж, 1998.

22. Азаров И.С. Вычисление мгновенных гармонических параметров речевого сигнала / И.С. Азаров, A.A. Петровский // Речевые Технологии. - 2008. -№ 1.-С. 67-77.

23. Акустика: Справочник / Под ред. Сапожкова М.А. - 2-е изд., перераб. и доп. - М.: Радио и связь, 1989. - 336 с.

24. Акустическая экспертиза каналов речевой коммуникации. Монография / Дидковский B.C., Дидковская М.В., Продеус А.Н. - Киев, 2008. - 420 с.

25. Алдошина И.А. Основы психоакустики [Электронный ресурс] // Режим доступа: http://www.625-net.ru.

26. Алюшин В.М. Акустические технологии для систем мониторинга функционального состояния персонала АЭС / М.В. Алюшин, A.B. Алюшин,

B.М. Алюшин, C.B. Дворянкин, JI.B. Колобашкина // Высокие технологии, исследования, образование, финансы. Сборник статей Шестнадцатой международной научно-практической конференции "Фундаментальные и прикладные исследования, разработка и применение высоких технологий в промышленности и экономике" 5-6 декабря 2013 года, Санкт-Петербург, Россия. - Санкт-Петербург, Изд-во Политехи, ун-та, 2013. -

C.68-70.

27. Алюшин В.М. Акустические технологии для «интеллектуальных» систем мониторинга функционального состояния оперативного состава управления объектами атомной энергетики / М.В. Алюшин, В.М. Алюшин, C.B. Дворянкин, JI.B. Колобашкина // Глобальная ядерная безопасность. - 2013. -№4(9). -С.63-71.

28. Алюшин В.М. Интерфейсные модули для макетирования систем сбора и обработки данных с реконфигурируемой структурой / М.В. Алюшин, A.B. Алюшин, В.М. Алюшин, JI.B. Колобашкина, H.A. Короткова // Естественные и технические науки. - 2011. — №4. — С.440-443.

29. Алюшин В.М. Реконфигурируемая шина для создания высокопроизводительных систем обработки данных со структурой, управляемой потоком данных / М.В. Алюшин, A.B. Алюшин, В.М. Алюшин, JT.B. Колобашкина // Естественные и технические науки. — 2011. — №4. — С.444-451.

30. Алюшин В.М. 3U и 6U модули цифровой обработки данных для макетирования систем с реконфигурируемой структурой / М.В. Алюшин, A.B. Алюшин, В.М. Алюшин, JI.B. Колобашкина, H.A. Короткова // Естественные и технические науки. - 2011. - №4. - С.452-455.

31. Алюшин В.М. Метод реконструкции гармонической структуры спектральных описаний искаженной шумами и помехами речи / C.B. Дво-рянкин, В.М. Алюшин // Известия института инженерной физики. -2013. - Том 2. - №28. - С.57-62.

32. Алюшин В.М. Технологии образного анализа в задачах цифровой обработки речевой информации / В.М. Алюшин, C.B. Дворянкин // Научная визуализация. - 2013. - Том 5. - №3. - С. 75-88.

33. Алюшин В.М. Восстановление гармонической структуры искаженных речевых вокализмов посредством цифровой обработки изображений динамических спектрограмм / В.М. Алюшин, C.B. Дворянкин // Безопасность информационных технологий. - 2013. - №3. - С. 41-49.

34. Баскаков С.И. Радиотехнические цепи и сигналы / С.И. Баскаков. М.: Высшая школа, 2-е издание. - 446 с.

35. Беляев A.A. Функциональные возможности, основные параметры и условия эксплуатации сигнального процессора 1892ВМ2Я / A.A. Беляев // Оборонный комплекс - научно-техническому прогрессу России. М.: ФГУП «ВИМИ». - 2012. - № 2. - С. 25-26.

36. Беляев A.A. Сигнальные процессоры платформы «Мультикор»: основные характеристики и особенности архитектуры / A.A. Беляев // Оборонный комплекс - научно-техническому прогрессу России. М.: ФГУП «ВИМИ». - 2011. - № 1. - С. 85-87.

37. Быков С.Ф. Цифровая телефония: Учеб. пособие для вузов / С.Ф. Быков, В.И. Журавлев, И.А. Шалимов // М.: Радио и связь. - 2003. - 144 с.

38. Быков Ю.С. Теория разборчивости речи в линиях связи / Ю.С. Быков // М.: Оборонгиз, 1953.

39. Быков Ю.С. Теория разборчивости речи и повышение эффективности радиотелефонной связи / Ю.С. Быков. - М.: Госэнергоиздат, 1959. -350с.

40. Быков Ю.С. Составление артикуляционных таблиц русской речи и метод определения звуковой разборчивости / Ю.С. Быков // М.: Труды Комиссии по акустике АН СССР. - 1951. - Т.6.

41. Варганов Н.О. Сравнение различных методов артикуляционных измерений / Н.О. Варганов // Информационный листок НИЛ МЭС и ЭП. - 1953. № 12(112).

42. Видеокарта NVidia GeForce GT 640М [Электронный ресурс] // NVIDIA. - Режим доступа:

http://www.nvidia.ru/obiect/geforce-gt-640m-ru.html#pdpContent=2.

43. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винцюк // Киев: Навукова думка. - 1987. - 264 с.

44. Вокодерная телефония / Под ред. A.A. Пирогова // М.: Связь, 1974 - 535 с.

45. Волчихин В.И. Использование тайных биометрических образов человека / В.И. Волчихин, А.И. Иванов //М.: Системы безопасности. - 2002. -№ 2 (44). - С. 40-42.

46. Гавриленко О.В. Расчет и измерение разборчивости речи при малых отношениях сигнал-шум. Часть 1. Корректное измерение функции распределения речевого сигнала / О.В. Гавриленко, B.C. Дидковский, А.Н. Продеус // Электроника и связь, Тематический выпуск «Проблемы электроники», ч. 1. - 2007. - С. 137-141.

47. Гавриленко O.B. Расчет и измерение разборчивости речи при малых отношениях сигнал-шум. Часть 2. Коррекция коэффициентов восприятия / О.В. Гавриленко, B.C. Дидковский, А.Н. Продеус // Электроника и связь, Тематический выпуск «Проблемы электроники», 4.1. - 2007. - С. 142— 147.

48. Гавриленко A.B. Парциальные отношения сигнал-шум в роли критерия, альтернативного разборчивости речи / A.B. Гавриленко, B.C. Дидковский, А.Н. Продеус // Электроника и связь. - 2006. - № 4. - С. 48-53.

49. Гавриленко A.B. Сопоставление версий формантного метода оценки разборчивости речи / A.B. Гавриленко, B.C. Дидковский // Электроника и связь. Тематический выпуск «Проблемы электроники», 4.1. — 2008. — С. 227-231.

50. Герасименко В.Г. Методы защиты акустической речевой информации от утечки по техническим каналам / В.Г. Герасименко, Ю.Н. Лаврухин, В.И. Тупота // М.: РЦИБ «Факел», 2008. - 256 с.

51. Гидроакустический канал связи [Электронный ресурс] // V-RATIO Business Consulting Company. - Режим доступа: http://www.v-ratio.ru/more/036-gi droakustika.html.

52. Голубинский А.Н. Математические модели речевых сигналов для верификации и идентификации личности по голосу: монография / А.Н. Голубинский, О.М. Булгаков — Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2010 . - 364 с.

53. Голубинский А.Н. Модели речевых сигналов для аутентификации личности по голосу / А.Н. Голубинский: диссертация - Воронеж, 2010.

54. ГОСТ Р 50840-95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости.

55. Графические процессоры NVIDIA GeForce [Электронный ресурс] // NVIDIA. - Режим доступа: http://www.nvidia.ru/obiect/geforce-familv-ru.html.

56. Графические ускорители Tesla для серверов [Электронный ресурс] // NVIDIA. - Режим доступа: http://www.nvidia.ru/obiect/tesla-server-gpus-ru.html.

57. Гусятинский И.А. Радиосвязь и радиовещание / И.А. Гусятинский, A.A. Пирогов. - М.: Советское радио, 1974.

58. Дворянкин C.B. Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи /C.B. Дворянкин, A.A. Мишуков // Спецтехника и связь. - 2011. - №1. - С. 40-47.

59. Дворянкин C.B. Цифровая шумоочистка аудиоинформации. Под ред. A.B. Петракова. М.: ИП РадиоСофт. - 2011. - 208 с.

60. Дворянкин C.B. Цифровая обработка изображений динамических спектрограмм аудиосигналов в задачах безопасности речевой связи / C.B. Дворянкин //Специальная техника. - 2000. - № 3. - С. 37-44.

61. Дворянкин C.B. Взаимосвязь цифры и графики, звука и изображения / C.B. Дворянкин. М.: Открытые системы. №3. 2000. - С. 34-42.

62. Дворянкин C.B. Очистка речевого сигнала от шумов и помех посредством цифровой обработки изображений его сонограмм /C.B. Дворянкин //Тезисы докладов международной конференции «Обработка информации в компьютерных системах», МТУСИ. —1997. -С.179-180.

63. Дворянкин C.B. Защита речевых сообщений с использованием компьютерных технологий обработки изображений /C.B. Дворянкин // Материалы конференции «Телекоммуникационные и вычислительные системы» в рамках международного конгресса «Коммуникационные технологии и сети» (CTN-2002) международного форума информатизации (МФИ 2002). М.: МТУСИ. 2002. - С. 167.

64. Дворянкин C.B. Исследование возможностей применения методов цифровой обработки изображений к анализу-синтезу звуков и речи / C.B. Дворянкин // Материалы научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. Сборник №3. М.: МТУСИ. 2003. - С. 29-30.

65. Дворянкин C.B. Цифровая обработка изображений графических образов звуков и речи применительно к их защите от НСД /C.B. Дворянкин // «Информация и безопасность». Воронеж: Воронеж, гос. техн. ун-т. 2002. -Вып. 2.-С. 242-243.

66. Дворянкин C.B. Обоснование критериев эффективности защиты речевой информации от утечек по техническим каналам /C.B. Дворянкин, Ю.К. Макаров, A.A. Хорев // Защита информации Инсайд. - 2007. - №2. -С. 18-25.

67. Дворянкин C.B. Методы закрытия речевых сигналов в телефонных каналах / C.B. Дворянкин, Д.В. Девочкин // Защита информации. Конфидент. — 1995.-№5.-С. 45-59.

68. Дворянкин C.B. Обеспечение безопасности речевой связи в Internet-телефонии / C.B. Дворянкин, И.С. Морозов, A.A. Рогачев // Тезисы докладов IV межрегионального научно-технического семинара «Применение пластиковых карт и защита информации». - М.: МНТОРЭС им. A.C. Попова.- 1999.-С. 49-51.

69. Дворянкин C.B. Технология речевой подписи / C.B. Дворянкин // М.: Открытые системы. - 1997. -№ 5 (25). - С. 68-71.

70. Дворянкин C.B. Восстановление разборчивости искаженных речевых сообщений программными средствами. (Асинхронная двухканальная шумоочистка фонограмм) / C.B. Дворянкин // Доклад на конференции «Информационная безопасность компьютеризированных систем». М.: Гротек. - 2000.- С. 53-56.

71. Дворянкин C.B. Требования к построению сонограмм при реализации компьютерных технологий безопасности речевой связи /C.B. Дворянкин // Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУ СИ. М.: МТУ СИ. - 1999. - С.74-76.

72. Дворянкин C.B. Система протоколирования искаженных помехами и шумами речевых фонограмм / C.B. Дворянкин, В.Р. Женило // Тезисы докладов международной конференции «Информатизация правоохрани-

тельных систем». M.: Академия управления МВД РФ, часть 2. - 1998. -С. 85 -89.

73. Дворянкин C.B. Речевая подпись / C.B. Дворянкин // М.: МТУСИ. -2003.-238 с.

74. Дворянкин C.B. Эксперименты по восстановлению искаженной шумами речи / C.B. Дворянкин // Управление безопасностью. - 2004. - № 1. — С. 42-46.

75. Дидковский B.C. Акустическая экспертиза каналов речевой коммуникации / B.C. Дидковский, М.В. Дидковская, А.Н. Продеус // Монография. — К: Имэкс-ЛТД, 2008. - 420 с.

76. Дщковський B.C. Основи арх1тектурно1 та ф1зюлопчно\' акустики / B.C. Дщковський, С.А. Луньова. - К.: Нащональний ушверситет Украши «Кшвський полггехшчний ш статут». — 2001. — 422 с.

77. Домрачев A.A. Общие вопросы информационной безопасности и программа создания ИТКС / A.A. Домрачев // Защита информации. Конфидент. - 1995. - № 3. - С. 86-92.

78. Железняк В.К. Некоторые методические подходы к оценке эффективности защиты речевой информации / В.К. Железняк, Ю.К. Макаров, A.A. Хореев // Специальная техника. - 2000. - № 4. - С. 39-45.

79. Женило В.Р. Компьютерная фоноскопия / В.Р. Женило. - М.: Из-во Академии МВД РФ. - 1995.- 208 с.

80. Жиляков Е.Г. Об одном методе очистки речи от шумов на основе применения фильтрующей субполосной матрицы / Е.Г. Жиляков, A.B. Кур-лов, A.B. Эсауленко, Н.В. Котович // Доклады 11-й Международной Конференции DSPA-2011.

81. Зверев Е. Ускорение инженерных расчетов в Ansys Mechanical при использовании GPU NVIDIA Tesla / Е. Зверев, Ю. Новожилов, Д. Михалюк // Рациональное управление предприятием. - 2011. - №3. - С.80-85.

82. Зверев В.А. Выделение сигналов из помех численными методами / В.А. Зверев, A.A. Стромков. - Нижний Новгород: ИПФ РАН. - 2001. - 188 с.

83. Измерение разборчивости речи: модуляционный подход [Электронный ресурс] // Режим доступа: http://habrahabr.ru/post7130682/.

84. Калинин C.B. Виброакустическое зашумление помещений - иллюзии и реальность / C.B. Калинин // Защита информации. Конфидент. - 2001. - № 4 (40).-С. 38-42.

85. Калинин C.B. О некоторых новых тенденциях в развитии систем виброакустического зашумления / C.B. Калинин // Защита информации. Конфидент. 1999. - № 4-5 (27). - С. 74-79.

86. Калинцев Ю.К. Разборчивость речи в цифровых вокодерах / Ю.К. Ка-линцев. - М.: Радио и связь. - 1991- 320 с.

87. Кириллов С.Н. Теоретические основы асинхронного маскирования речевых сигналов / С.Н. Кириллов, Д.Ю. Малинин: Учеб. пособие. - Рязань: Рязан. гос. радиотехн. акад. - 2000. - 80 с.

88. Конспект лекций по курсу "Акустика" для студентов специальности "Аудиовизуальная техника" [Электронный ресурс] // Статьи по акустике помещений / Режим доступа: http://inform-hifi.narod.ni/l l.htm.

89. Левковская Т.В. Идентификация спектральных изображений речи / Т.В. Левковская // Сб. Анализ цифровых изображений. - Минск: ОИПИ HAH Б., 2003.-С. 186-193.

90. Ли У.А., Неибург Э.П. Методы автоматического распознавания речи / У .А. Ли, Э.П. Неибург. - М.: Мир. - 1983. - Кн. 1. - 326 с.

91. Лопатина С.А. Актуальные задачи речевой акустики / С.А. Лопатина, Е.М. Максимов, Ю.Н. Ромашкин // Речевые технологии. — 2008. - №2. -С. 66-70.

92. Майская В. Сигнальные процессоры / В. Майская // Электроника: Наука, Технология, Бизнес. - 2010. -№5. — С. 1-8.

93. Меньшаков Ю.К. Виды и средства иностранных технических разведок / Ю.К. Меньшаков: учеб.пособие. - М.: Изд. МГТУ им. Н.Э. Баумана, 2009. - 656 с. : ил.

94. Методические указания Минсвязи России Р 45.13-2002. Поиск и устранение причины несоответствия нормам электрических параметров коммутируемых каналов телефонной сети общего пользования. Дата введения: 2002 г.

95. Минаев В.А. Речевые технологии в криминалистической фоноскопии / В.А. Минаев, JI.C. Чудновский, И.Н. Чудновская: Учебное пособие. Часть 1. Красноярск: Красноярская высшая школа МВД России. — 1997. - 173 с.

96. Михайлов В.Г. Из истории исследований преобразования речи / В.Г. Михайлов // Речевые Технологии. - 2008. - №1. - С. 93-113.

97. Мишуков A.A. Моделирование процессов управления речевой разборчивостью в многоканальных системах конфиденциальной голосовой связи / A.A. Мишуков: Автореферат кандидатской диссертации, Воронеж: типография Воронежского института МВД России, 2012.

98. Некоторые оконные функции и их параметры [Электронный ресурс] // Теория и практика цифровой обработки сигналов. - Режим доступа: http://www.dsplib.ru/content/winadd/win.html.

99. Пирогов A.A. Основы фонетической теории речи / A.A. Пирогов // Русская мысль. - 2010. -№ 1-12. - С. 99-109.

100. Покровский Н.Б. Расчет и измерение разборчивости речи / Н.Б. Покровский. - М.: Гос. Изд-во литературы по вопросам связи и радио, 1962. -392 с.

101. Покровский Н.Б. Расчет и измерение разборчивости речи / Н.Б. Покровский. -М.: Связьиздат, 1963. — 472 с.

102. Продеус А.Н. О некоторых особенностях развития объективных методов измерений разборчивости речи / А.Н. Продеус // Электроника и связь. -2010.-№2.-С. 217-223.

103. Прэтт У. Цифровая обработка изображений / У. Прэтт: Пер. с англ. - М.: Мир, 1982.-Кн. 1.-312 е., ил.

104. Прямая инверсия речевого спектра [Электронный ресурс] // Режим доступа: http://signals.radioscanner.ru/base/signal 11/.

105. Рабинер J1.P. Цифровая обработка речевых сигналов / Л.Р. Рабинер, Р.В. Шафер: Пер. с англ. / Под ред. М.В. Назарова и Ю.Н. Прохорова. М.: Радио и связь. - 1981. - 496 с.

106. Раев А.Н. Анализ влияния состояния наркотического опьянения на характеристики голосов дикторов / А.Н. Раев, Ю.Н. Матвеев, Т.И. Голо-щапова // Научно-технический вестник информационных технологий, механики и оптики. - 2012. - № 5 (81).

107. Рашевский Я.И. Обзор зарубежных методов определения разборчивости речи [Электронный ресурс] / Я.И. Рашевский, В.Л. Каргашин // Специальная техника. - 2002. - № 3-6. - Режим доступа: http://www.detektor.ru/publication/d2003 1 .htm.

108. Результаты отборочного этапа NeoQUEST-2013 и способы прохождения заданий [Электронный ресурс] // Блог компании НеоБИТ. - Режим доступа: http://habrahabr.ru/company/neobit/blog/170679/.

109. Сапожков М.А. Вокодерная связь / М.А. Сапожков, В.Г. Михайлов // М.: Радио и связь. - 1983. -248 с.

110. Сапожков М.А. Речевой сигнал в кибернетике и связи / Сапожков М.А. // М.: Связьиздат. - 1963.-472 с.

111. Секреты стеганографии [Электронный ресурс]// SecurityLab. - Режим доступа: http://www.securitylab.ru/analytics/216270.php.

112. Система Tsubame 2.0 с GPU NVIDIA Tesla стала самым энергетически действенным петафлопсным суперкомпьютером в мире [Электронный ресурс]. - Режим доступа: http://it-speech.ru/?p=3123.

113. Собынин В.Н. Защита информации в выделенных помещениях / Собы-нин В.Н. // "ИНФОРМОСТ" - "Радиоэлектроника и Телекоммуникации". -2012. -№ 1.-С. 25-28.

114. Статистика разрешений экрана [Электронный ресурс] // Режим доступа: http://www.fortress-design.com/displav-resolution/.

115. Степанов A.B. Методы компьютерной обработки сигналов систем радиосвязи / A.B. Степанов, С.А. Матвеев. - М.: СОЛОН-Пресс. - 2003. -146 с.

116. Стешко В. Алгоритмы цифровой обработки сигналов: реализация на ПЛИС / В. Стешко // Цифровая обработка сигналов. - 2006. - № 6. — С. 86-93.

117. Сударев И.В. Криптографическая защита телефонных сообщений / И.В. Сударев // Специальная техника. - М. 1998. - № 2. - С. 47-55.

118. Тарасов И.Е. Системы на кристалле на базе FPGA Xilinx со встроенными процессорами Power PC / И.Е. Тарасов // Компоненты и технологии. - №7 — 2005.-С. 62-67.

119. Хитров М.В. Распознавание русской речи: состояние и перспективы / М.В. Хитров // Речевые Технологии. - 2008. -№1. - С. 83-87.

120. Хорев A.A. К оценке эффективности защиты акустической (речевой) информации / A.A. Хорев, Ю.К. Макаров // Специальная техника. 2000. - №5. -С. 46-57.

121. Хорев A.A. Оценка эффективности защиты информации от утечки по техническим каналам / A.A. Хорев // Специальная техника. 2006. - № 6 — С. 53-61.

122. Хорев A.A. Средства акустической разведки: проводные микрофонные системы и электронные стетоскопы / A.A. Хорев // Спецтехника и связь. -2008.-№2.-С. 36-42.

123. Фант Г. Акустическая теория речеобразования / Г. Фант / Пер. с англ. Варшавского Л.А., Медведева В.И.; под ред. Григорьева B.C. - М.: Наука. -1964.-284 с.

124. Фланаган Дж.Л. Анализ, синтез и восприятие речи / Дж.Л. Фланаган / Пер. с англ. Под ред. Пирогова A.A. - М.: Связь. - 1968. - 396 с.

Приложение А. Описания и точность оконных функций

М—1

Во всех формулах N - база Фурье, М - ширина окна, А = ——. В качестве критерия точности оконной функции использовалась метрика Минковского эталонного изображения и построенной с помощью оконной функции изображения спектрограммы.

Таблица А.1 - Сравнительная характеристика оконных функций

Название оконной функции Формула График оконной функции М = N12 = 512 М = Л = 1024

Спектрограмма Норма разности Спектрограмма Норма разности

1 2 3 4 5 6 7

Прямоугольное окно ( л (1, п е [0, м — 1] с с С 0.089 0.132

Окно Барлетта П | и/(тг) = 1---1 А 1 06 05 03 1 0.072 0.096

Синус-окно /ПП\ и/(гг) = эт^—) 1 С» в? о; д 1 0.079 | 0.108

Ш"

Окно Блэкма-на-Наталла и/(п) = 0.3635819-0.4891775 СОБ^—] + +0.1365995 соб!-—)- —0.0106411 СОБ \ ОБ 05 0< д 1 0.033 1 0.039

01 0.2 03 04 0.5 06 07 08 09 1

Окно с плоской

вершиной

IV (п) = = 0.215578948 -

-0.416631580 СОБ ] +

(2пп\

+0.277263158 соб (—-) -

/Злтг\

-0.083578947 СОБ (—г-) + +0.006947368 соб

/4лтг\

0.070

0.065

Окно Ханна

, ч /ПП\

и/(п) = 0.5 - 0.5 соб )

0.063

0.072

Окно Наталла

и/(п) = 0.355768-

г7ГП>

Т

/7ТП\

-0.487396 сое (—) +

+0.144232 сое —0.012604 СОБ

/2пп Зттп

(5ПП\

1~Т/

0.034

0.038

Окно Ланцоша

XV (п) =

'»("е-1)) -е-о

0.073

0.097

Окно

Барлетта-

Ханна

I п

\к{п) = 0.62 - 0.24 — — 1

-0.38СО5

(ЛПл

0.061

0.077

Окно Блэкмана и/(п) = 0.42 - 0.5 С05 ] + /2пп\ +0.08 СОБ —) од 0 | У 0 0.043 0.054

01 02 ал 0« ОЬ иЬ С 7 08 09 1

Окно Блэкмана- Харриса и/(п) = 0.35875 - -0.48829 СОБ + /2лп\ +0.14128 соб (] — -0.01168 соб/ — ) 0 0 0 0 а Д ф 0.033 $ 0.038

/

Окно Хэммин- = 0.53836 - о /л 0.061 0.071

га —0.46164 соб^—) 0 /V 0

Окно Гаусса, а — 0.07 уП-А\2 и/(гг) = е 2\ао) о» С У 1 с. о; 1 0 0.086 0.086

Окно Гаусса, <7 = 0.17 ггп-А\2 и>(тг) — е 2\Аа) 06 1 05- л 01 Я 03 1 07 1 0 0.024 0 0.024

О' С2 03 0.4 05 06 07 08 09 1

Окно Гаусса, а = 027 1 (п-А\2 ]лг(п) = е 2УАа ) А/ 0 0.032 0 0.032

01 П? 03 04 04 06 0 ' 118 09 1

оо

Приложение Б. Исходные коды библиотеки алгоритмов

Реализация фильтров на языке С++

#ifndef_CUDA_FILTERS_CUH_ #define _CUDA_FILTERS_CUH_

include "cuda.h" #include "cuda_runtime.h" #include "cudasettings.cuh" // Обрезание верхней части спектра

_global_void filter_half_nfft(lc* data, int Nx)

{

int у = threadldx.x; lc *p = data+y*Nx; for(int i=Nx/2;i<Nx;i++) p[i]-x = p[i].y = 0;

}

// Нахождение локальных максимумов

_global_void filter_local_maximums(lc* data, int Nx)

{

int у = threadldx.x; lc *p = data+y*Nx;

Id abO = cabs(p[0]); p[0].x = p[0].y = 0; Id abl = cabs(p[l]);

for(int i=l;i<Nx/2;i++) {

Id ab2 = cabs(p[i+l]);

if (abKabO || abl<ab2) p[i].x = p[i].y = 0;

abO = abl;

abl = ab2;

//Нахождение основного тона

_device_Id find_maintone(lc* р, int Nx, int rate)

{

ld fstep = ld(rate)/Nx; int min_pos = (int)(80 / fstep); int max_pos = (int)(1000 / fstep); int tone_pos = 0; ld toneval = 0;

for (int x = min_pos; x < max_pos && x < Nx; x++) {

ld new_val = cabs(p[x]);

if (new_val > tone_val) {

tone_val = new_val; tone_pos = x;

}

}

ld tone_val2a = cabs(p[tone_pos/2]); ld tone_val2b = cabs(p[tone_pos/2 + 1]);

if (tone_val2a > tone_val2b) {

if (abs(tone_val2a - tone_val) < 2*tone_val/3) {

tone_val = tone_val2a; tone_pos = tone_pos/2;

}

}

eise {

if (abs(tone_val2b - tone_val) < 2*tone_val/3) {

tone_val = tone_val2b; tone_pos = tone_pos/2 + 1;

Id tone_val3a = cabs(p[tone_pos/3]); Id tone_val3b = cabs(p[tone_pos/3 + 1]);

if (tone_val3a > tone_val3b) {

if (abs(tone_val3a - tone val) < 2*tone_val/3) {

toneval = tone_val3a; tone_pos = tone_pos/3;

}

}

else {

if (abs(tone_val3b - tone val) < 2*tone_val/3) {

toneval = tone_val3b; tone_pos = tone_pos/3 + 1;

}

}

Id yO = cabs(p[tone_pos-l]); Id yl = cabs(p[tone_pos]); Id y2 = cabs(p[tone_pos+l]); Id a = (y2-2*yl+y0)/2; Id b = yl-y0-a*(2*tone_pos-l); return -b/(2*a);

}

// Нахождение гармоник, кратных основному тону

_global_void filter_multiple_garmonics(lc* data, int Nx, int rate)

{

int у = threadldx.x; lc *p = data+y*Nx;

Id tone = find_maintone(p, Nx, rate);

if (tone < 5) tone = Nx; Id j = tone;

for(int i=0;i < Nx/2; i++) {

if (i < j)

p[i].x = p[i].y = 0;

else

j += tone;

}

}

// Протяжка фазы

_global_void filter_phase_broach(lc* data, int Nx, int rate, int step, int size)

{

int у = threadldx.x; Id fstep = ld(rate)/Nx;

for(int i=0;i<size;i++) {

Id ab = cabs(data[i*Nx+y]);

if (ab > le-5) {

if (i>0)

for(int j=max(0, y-3); j<=min(y+3,Nx/2-1); j++) {

if (cabs(data[(i-l)*Nx+j])>le-5) {

Id fi = atan2(data[(i-1) *Nx+j].y, data[(i-l)*Nx+j].x);

fi += y*fstep*step/rate;

data[i*Nx+y].x = ab*cos(fi);

data[i*Nx+y].y = ab*sin(fi);

break;

}

}

syncthreadsQ;

#endif

Реализация алгоритмов преобразования звуковых файлов на языке С++

#ifndef_CUDA_GRAPHICS_CUH_ #define _CUDA_GRAPHICS_CUH_

#include "cuda_settings.cuh"

_global_void calc_sonogram(lc* data, int *colors, int Nx)

{

int x = blockldx.x; int у = threadldx.x;

int с = (int)(20 * log(l+pow(data[y*Nx+x].x, 2)+pow(data[y*Nx+x].y, 2))/log(10.0) ); if (c > 255) с = 255; colors [у *(Nx/2)+x] = c;

}

_global_void calc_amplitudes(lc* data, Id *amp, int Nx)

{

int x = blockldx.x; int у = threadldx.x;

amp[y*(Nx/2)+xl = 20 * log(l+pow(data[y*Nx+x].x, 2)+pow(data[y*Nx+x].y,

2))/log(10.0); }

_global_void calc_fazogram(lc* data, int * colors, int Nx, int step)

{

Id PI = 3.1415926535897932384626433832795; int x = blockldx.x; int у = threadldx.x;

int с = (int)(20 * log(l+pow(data[y*Nx+x].x, 2)+pow(data[y*Nx+x].y, 2))/log(10.0));

if (c > 255) c = 255;

Id CurrentFi = atan2(data[(y+l)*Nx+x].y, data[(y+l)*Nx+x].x); Id PreviousFi = atan2(data[y*Nx+x].y, data[y*Nx+x].x); Id Freq = ((2 * PI) / Nx) * x; Id dfi = sin((CurrentFi - PreviousFi - Freq*step));

//float dfi = log(absins(CurrentFi - PreviousFi - Freq*step)/1000+0.001); colors[(y+l)*(Nx/2)+x] = 255*abs(dfi); //int(255*(l - dfi)/2);

}

_global_void calc_fazogram_zero(lc* data, int *colors, int Nx, int step)

{

int x = blockldx.x; colors [x] = 0;

}

_global_void calc_maintone_l(lc* data, int * colors, int Nx, int rate)

{

//int x = blockldx.x;

int y = threadldx.x;

Id fstep - ld(rate)/Nx;

int min_pos = (int)(80 / fstep);

int max_pos = (int)(250 / fstep);

int tone_pos = 0;

Id toneval = 0;

for (int x = min_pos; x < max_pos && x < Nx; x++) {

Id new_val = sqrt(pow(data[y*Nx+x].x, 2)+pow(data[y*Nx+x].y, 2));

if (newval > tone_val) {

toneval = newval; tone_pos = x;

}

}

Id tone_val2a = sqrt(pow(data[y*Nx+tone__pos/2].x, 2)+pow(data[y*Nx+tone_pos/2].y,

Id tone_val2b = sqrt(pow(data[y*Nx+tone_pos/2 + l].x, 2)+pow(data[y*Nx+tone_pos/2

+ i].y, 2));

if (tone_val2a > tone_val2b) {

if (abs(tone_val2a - tone_val) < tone_val/2) {

tone_val = tone_val2a; tone_pos = tone_pos/2;

}

}

else {

if (abs(tone_val2b - toneval) < tone_val/2) {

tone_val = tone_val2b; tone_pos = tone_pos/2 + 1;

}

}

for (int x = 0; x<Nx/2; x++) {

colors[y*(Nx/2)+x] = 255*((x % tone_pos)==0 && x>0);

}

_global_void calc_maintone_2(lc* data, int * colors, int Nx, int rate)

{

//int x = blockldx.x;

int y = threadldx.x;

Id fstep = ld(rate)/Nx;

int min_pos = (int)(70 / fstep);

int max_pos = (int)(750 / fstep);

int tone_pos = 0;

Id tone val = 0;

for (int x = min_pos; x < max_pos && x < Nx; x++) {

Id new_val = sqrt(pow(data[y*Nx+x].x, 2)+pow(data[y*Nx+x].y, 2));

if (new_val > tone_val) {

tone_val = new_val; tone_pos = x;

}

}

Id tone_val2a = sqrt(pow(data[y*Nx+tone_pos/2].x, 2)+pow(data[y*Nx+tone__pos/2].y,

2));

Id tone_val2b = sqrt(pow(data[y*Nx+tone_pos/2 + l].x, 2)+pow(data[y*Nx+tone_pos/2 + l].y,2));

if (tone_val2a > tone_val2b) {

if (abs(tone_val2a - tone_val) < 2*tone_val/3) {

toneval = tone_val2a; tone_pos = tone_pos/2;

}

}

else {

if (abs(tone_val2b - tone_val) < 2*tone_val/3) {

tone_val = tone_val2b; tone_pos = tone__pos/2 + 1 ;

}

}

Id tone_val3a = sqrt(pow(data[y*Nx+tone_pos/3].x, 2)+pow(data[y*Nx+tone_pos/3].y,

2));

Id tone_val3b = sqrt(pow(data[y*Nx+tone_pos/3 + l].x, 2)+pow(data[y*Nx+tone_pos/3

+ l].y, 2));

if (tone_val3a > tone_val3b) {

if (abs(tone_val3a - tone_val) < 2*tone_val/3) {

tone_val = tone_val3a; tone_pos = tone_pos/3;

}

else {

if (abs(tone_val3b - tone_val) < 2*tone_val/3) {

toneval = tone_val3b; tone_pos = tone_pos/3 + 1 ;

}

}

for (int X = 0; x<Nx/2; x++) {

colors [y * (Nx/2)+x] = 0;

}

Id yO = sqrt(pow(data[y*Nx+tone_pos-l].x, 2)+pow(data[y*Nx+tone_pos-l].y, 2));

Id yl = sqrt(pow(data[y*Nx+tone_pos].x, 2)+pow(data[y*Nx+tone_pos].y, 2));

Id y2 = sqrt(pow(data[y*Nx+tone_pos+l].x, 2)+pow(data[y*Nx+tone_pos+l].y, 2));

Id a = (y2-2*yl+y0)/2;

Id b = yl-y0-a*(2*tone_pos-l);

Id tone_pos2 = -b/(2*a);

if (tone_pos2 > 5) {

for(int i=l; (int)(i*tone_pos2)+l <Nx/2; i++) {

colors [y*(Nx/2)+(int)(i*tone_pos2)] = 255; //colors[y*(Nx/2)+(int)(i*tone_pos2)+l] = 255;

}

}

_global_void calc_maintone_20130402(lc* data, int *colors, intNx, int rate)

{

//int x = blockldx.x;

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.