Адаптивные системы обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканале тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Дмитриев Владимир Тимурович
- Специальность ВАК РФ00.00.00
- Количество страниц 383
Оглавление диссертации доктор наук Дмитриев Владимир Тимурович
Оглавление
Введение
1 Разработка алгоритма параллельной обработки в радиотехнических системах на основе модификации алгоритма Хургина - Яковлева
1.1 Вводные замечания
1.2 Модификация алгоритма Хургина - Яковлева при различном количестве каналов обработки
1.2.1 Модификация алгоритма обработки на основе представления Хургина -Яковлева
1.2.2 Реализационные возможности синтезирующих фильтров модификации алгоритма Хургина - Яковлева
1.2.3 Оценка точности вычисления производной сигнала для модификации алгоритма Хургина - Яковлева
1.3. Оценка точности обработки сигналов на основе модификации алгоритма Хургина - Яковлева
1.3.1 Экспериментальные исследования помехоустойчивости алгоритма обработки на основе модификации алгоритма Хургина - Яковлева
1.4 Многоэтапное разложение сигналов радиотехнических устройств на основе модификации алгоритма Хургина - Яковлева
1.4.1 Модификация алгоритма Хургина - Яковлева при повторном разложении исходного сигнала
1.4.2 Оценка помехоустойчивости двухэтапного и трехэтапного разложения
1.5 Реализация банков фильтров на основе модификации алгоритма Хургина - Яковлева
1.6 Выводы
2 Реализация кодеков речевых сигналов в радиотехнических устройствах на основе модификации алгоритма Хургина - Яковлева
2.1 Вводные замечания
2.2 Реализация кодеков речевых сигналов на основе модификации алгоритма Хургина - Яковлева
2.2.1 Модификации кодеков формы
2.2.2 Модификация кодека АДИКМ на основе модификации алгоритма Хургина - Яковлева при наличии шумов квантования и акустических помех
2.2.3 Разработка полосового вокодера на основе модификации алгоритма Хургина - Яковлева
2.2.4 Реализация низкоскоростных кодеков на основе алгоритмов CELP и модификации алгоритма Хургина - Яковлева
2.2.5 Реализация алгоритмов низкоскоростного кодирования со скоростью передачи ниже 1 кбит/с на основе модификации алгоритма Хургина -Яковлева
2.2.6 Эффективность реализации кодеков речевых сигналов на основе модификации алгоритма Хургина - Яковлева
2.3Реализация кодеков речевых сигналов на основе вейвлет-пакетного
29
60
63
74
76
78
81
88
90
разложения и модификации алгоритма Хургина - Яковлева
2.4 Алгоритм передачи речевых сигналов в комплексном виде
2.4.1 Алгоритм представления речевых сигналов в комплексном виде
2.4.2 Полосовой вокодер на основе комплексного представления речевого сигнала
2.5 Выводы
3 Алгоритмы обработки речевых сигналов в радиоканале при действии акустических помех и шумов
3.1 Вводные замечания
3.2 Исследование воздействия акустических помех на кодеки речевых сигналов
3.2.1 Условия проведения эксперимента по исследованию воздействия акустических помех
3.2.2 Исследование воздействия акустических помех на кодеки речевых сигналов на основе теоремы В.А. Котельникова
3.2.3 Исследование воздействия акустических помех на кодеки речевых сигналов на основе модификации алгоритма Хургина - Яковлева
3.3 Исследование воздействий помех и искажений в радиоканале на качество речи на выходе кодеков
3.3.1 Воздействие помех и искажений в радиоканале на качество речи
3.3.2 Исследование воздействий помех и искажений в радиоканале на качество речи в кодеках на основе теоремы В.А. Котельникова
3.3.3 Исследование воздействий помех и искажений в радиоканале на качество речи в кодеках на основе модификации алгоритма Хургина -Яковлева
3.4 Исследование воздействий задержек и пропаданий блоков отсчетов в радиоканале на качество речи на выходе кодеков
3.5 Разработка и исследование алгоритмов уменьшения влияния помех и искажений в радиоканале на качество речи на выходе кодека
3.6 Алгоритмы восстановления речевого сигнала в низкоскоростных кодеках на основе итерационных методов
3.6.1 Исследование влияния статистических характеристик амплитудного и фазового спектра на качество речи
3.6.2 Итерационные алгоритмы восстановления речевой информации по амплитудному спектру
3.6.3 Итерационные алгоритмы восстановления речевой информации по отсчетам сигнала или его производной
3.6.4 Применение регуляризации алгоритма Фиенупа
3.7 Выводы
4 Алгоритмы оценки качества речи, наличия голосовой активности и параметров первичного кодека при действии акустических помех и шумов в радиоканале
4.1 Вводные замечания
90
97
99
101
101
102
102
105
107
112
114
120
135
146
4.2 Выбор информативных параметров зашумленной речи
4.2.1 Оценка качества речи на основе параметра функции ощущения спектральной динамики
4.2.2 Модификации информативных признаков при наличии тестового речевого сигнала
4.2.3 Информативные параметры при наличии только декодированного речевого сигнала
4.3 Оценка качества речи на основе метода изменения спектральной динамики
4.4 Комплексный алгоритм оценки качества речи
4.5 Оценка качества речи на основе модификации алгоритма Хургина -Яковлева для каналов прореженного сигнала и производной
4.6 Алгоритм определения голосовой активности
4.6.1 Алгоритм предварительного определения пауз речевых сигналов
4.6.2 Определение ОСШ и вида акустических помех на входе первичного кодека
4.7 Оценка параметров первичного кодирования
4.8 Выводы
5 Алгоритмы адаптивной передачи речевых сигналов
5.1 Вводные замечания
5.2 Алгоритмы построения систем передачи, осуществляющих изменение скорости передачи информации
5.2.1 Алгоритмы изменения скорости для адаптивных систем передачи речевых сигналов
5.2.2 Адаптивный кодек речевых сигналов
5.3 Алгоритмы адаптации первичных кодеков речи к акустическим помехам
5.3.1 Постановка задачи адаптации первичных кодеков к акустическим помехам
5.3.2 Алгоритм определения параметров акустических помех, действующих на входе первичного кодека
5.3.3 Алгоритм адаптации первичного кодека на основе теоремы В.А. Котельникова к акустическим помехам
5.3.4 Алгоритм адаптации первичных кодеков на основе модификации алгоритма Хургина - Яковлева к акустическим помехам
5.3.5 Алгоритм адаптации кодека CELP к акустическим помехам
5.4 Алгоритмы адаптации первичного кодека к шумам и искажениям в радиоканале
5.4.1 Постановка задачи адаптации первичных кодеков к шумам в радиоканале
5.4.2 Алгоритм адаптации первичных кодеков на основе теоремы В.А. Котельникова к шумам в радиоканале
5.4.3 Выбор оптимальных сочетаний помехоустойчивого кодека и кодека источника
153
158
163
166
183
203
210
218
5.4.4 Алгоритмы адаптации первичных кодеков на основе модификации алгоритма Хургина - Яковлева к искажениям в радиоканале
5.4.5 Алгоритм адаптации первичного кодека к состоянию радиоканала
5.5 Алгоритм совместной адаптации первичных кодеков к акустическим помехам и шумам в радиоканале
5.5.1 Алгоритм совместной адаптации первичных кодеков на основе теоремы В.А. Котельникова к акустическим помехам и шумам в радиоканале
5.5.2 Алгоритм совместной адаптации первичных кодеков на основе модификации алгоритма Хургина - Яковлева к акустическим помехам и шумам в радиоканале
5.6 Алгоритмы адаптации первичных кодеков речевых сигналов к особенностям речи
5.6.1 Алгоритм адаптации к темпу речи
5.6.2 Алгоритмы адаптации к голосу говорящего
5.7 Выводы
6 Алгоритмы защиты речевых сигналов и восстановления фонограмм от фальсификаций
6.1 Вводные замечания
6.2 Реализация алгоритмов маскирования речевых сигналов
6.2.1 Алгоритм асинхронного маскирования на основе модификации алгоритма Хургина - Яковлева
6.2.2 Исследование системы асинхронного маскирования речи на основе модификации алгоритма Хургина - Яковлева во временной области
6.2.3 Исследование системы асинхронного маскирования речи на основе модификации алгоритма Хургина - Яковлева в частотной области
6.3 Реализация алгоритмов защиты и восстановления фонограмм на основе модификации алгоритма Хургина - Яковлева
6.3.1 Алгоритм определения искажений и фальсификаций фонограмм на основе модификации алгоритма Хургина - Яковлева
6.3.2 Разработка решающего правила для алгоритма определения фальсификаций фонограмм
6.4 Разработка адаптивной защищенной системы связи
6.4.1 Определение требований к алгоритмам первичного и помехоустойчивого кодирования для защищенных систем передачи
6.4.2 Алгоритм совместной реализации методов кодирования, маскирования и восстановления фонограмм
6.4.3 Совместная реализация первичного кодека и алгоритмов маскирования и фальсификаций фонограмм
6.4.4 Исследование помехоустойчивости защищенной системы передачи 254 речевой информации
6.5 Выводы
7 Проектирование и реализация систем и сетей передачи, обработки и хранения информации на основе модификации алгоритма Хургина
234
247
252
Яковлева
7.1 Вводные замечания
7.2 Разработка методики выбора первичного кодека для систем на основе
теоремы В.А. Котельникова и модификации алгоритма Хургина
Яковлева
7.3 Разработка методики проектирования 1Р-сетей на основе модификации
алгоритма Хургина - Яковлева
7.4 Разработка адаптивной системы передачи, обработки и хранения речевых
сигналов с возможностью защиты фонограмм
7.5 Реализация первичных и помехоустойчивых кодеков на микропроцессоре
7.6 Выводы
Заключение
Список литературы
Приложение А Помехоустойчивость алгоритма обработки сигналов на основе
модификации алгоритма Хургина - Яковлева
Приложение Б Графики зависимостей и структурные схемы для кодеков на
основе модификации алгоритма Хургина - Яковлева
Приложение В Усредненные оценки качества речи на выходе первичных
кодеков
Приложение Г Объективные и субъективные оценки качества
восстановленной речи на выходе первичных кодеков
Приложение Д Структурные схемы и графики качества восстановленной речи
для адаптивных систем передачи
Приложение Е Данные для методики выбора кодеков при построении систем
передачи на основе теоремы В.А. Котельникова и модификации алгоритма
Хургина - Яковлева
Приложение Ж Акты внедрения
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Исследование и разработка алгоритмов обработки речевой информации на основе представления Хургина-Яковлева в радиотехнических устройствах2006 год, кандидат технических наук Дмитриев, Владимир Тимурович
Исследование и разработка методов повышения эффективности асинхронного маскирования речевых сигналов2001 год, кандидат технических наук Малинин, Дмитрий Юрьевич
Универсальное устройство помехоустойчивого кодирования, адаптивное к изменению условий функционирования радиосистемы передачи информации2013 год, кандидат наук Семин, Дмитрий Сергеевич
Методы и процедуры многокритериального синтеза многопозиционных радиосигналов для адаптивных к помехам систем передачи информации2022 год, доктор наук Лисничук Александр Александрович
Разработка нелинейных динамических систем адаптивной пространственно-временной обработки сигналов на фоне комплекса помех2000 год, доктор технических наук Паршин, Юрий Николаевич
Введение диссертации (часть автореферата) на тему «Адаптивные системы обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканале»
ВВЕДЕНИЕ
Актуальность темы исследования состоит в необходимости повышения качественных показателей радиотехнических систем обработки и передачи речевых сигналов (РС) в условиях акустических помех (АП) и шумов в радиоканале, на основе принципов адаптивной обработки сигналов. Применение адаптивных цифровых систем в этих условиях при обработке позволяет получить потенциально возможные характеристики радиотехнических устройств. Значительный вклад в области обработки речевой информации в радиотехнических системах внесли как зарубежные ученые - Г. Фант, Дж. Фланаган, Дж. Д. Маркел, А.Х. Грей и другие, так и отечественные - Л.М. Гольденберг, М.А. Сапожков, В.П. Яковлев, М.В. Назаров, Ю.Н. Прохоров, А.А. Ланнэ, В.Н. Сорокин, Ю.К. Калинцев, Г.В. Вемян, А.И. Величкин и др.
При практической реализации цифровых устройств обработки информации возникают трудности, связанные с тем, что спектр ограниченного во времени сигнала бесконечен в частотной области; идеальный низкочастотный фильтр, требуемый для точного восстановления сигнала, физически нереализуем; число выборок сигнала ограничено. В результате при практической реализации теоремы отсчетов В.А. Котельникова возникают ошибки наложения, вызванные бесконечным спектром сигнала, усечения, обусловленные конечным числом отсчетов, и округления, связанные с неточностью представления отсчетных значений в цифровом виде [1...6]. Для уменьшения перечисленных ошибок, а также для снижения вычислительных затрат возможно производить обработку сигналов на основе алгоритма, предложенного Я.И. Хургиным и В.П. Яковлевым. По сравнению с алгоритмом восстановления сигналов на основе теоремы В.А. Котельникова алгоритм Хургина - Яковлева обеспечивает возможность раздельной обработки как сигнала с верхней частотой спектра F, так и N-1 его первых производных, взятых с частотой дискретизации. В то же время,
данный алгоритм не обеспечивает точного восстановления исходного сигнала за счет неточности фазового спектра. Поэтому необходима модификация данного алгоритма, позволяющая уменьшить ошибку при восстановлении сигнала, за счет коррекции ФЧХ синтезирующего фильтра. [7...8].
Существующие алгоритмы первичного кодирования РС для радиосистем передачи информации (РСПИ) должны обеспечивать максимально высокое качество принятой речи (КПР) при минимальной избыточности передаваемого РС, обеспечивая минимально возможную скорость передачи в канале связи. Кроме того, они должны обеспечивать приемлемое качество восстановленной речи при действии АП и шумов в канале связи [11.14].
При реализации адаптивных систем передачи речевой информации важным является решение научной проблемы оценки качества восстановленной речи. Для РСПИ, работающих в реальном масштабе времени, необходима разработка алгоритма объективной оценки качества, обеспечивающей нужную корреляцию с данными усреднённой субъективной оценки. Кроме того, необходима разработка алгоритма оценки АП в паузах речи, обеспечивающего оценку вида АП и отношения сигнал-шум. Для обеспечения восстановления радиосвязи при сбое синхронизации необходимо разработать алгоритм оценки параметров используемого первичного кодека [15].
Для повышения эффективности РСПИ могут использоваться алгоритмы адаптации систем передачи информации за счет изменения параметров или алгоритмов первичного кодирования. Под эффективностью понимаются качество восстановленного сигнала, помехоустойчивость при действии АП и шумов в канале связи, снижение вычислительных затрат, а также снижение ошибок обработки. Для известных адаптивных систем передачи и обработки не существует протоколов или алгоритмов автоматической адаптации, когда осуществляется автоматический переход от одного алгоритма кодирования к
другому [16]. Не известны исследования первичных кодеков речи при действии АП и шумов в канале связи. Поэтому необходимо провести исследования первичных кодеков при действии АП, а также шумов и искажений в канале связи. Оптимизационная задача выбора алгоритмов первичного и канального кодирования рассмотрена в работах А.А. Ланнэ, В.В. Бабкина. Для решения данной задачи в работе предусмотрено создание адаптивной системы, включающей первичный и помехоустойчивый кодек, обеспечивающий хорошее качество восстановленного РС на выходе приемной части системы.
Наряду с помехоустойчивостью передаваемой информации важным критерием в ряде случаев является защищенность передаваемой информации. При этом использование алгоритмов защиты зачастую снижают помехоустойчивость и КПР. Поэтому необходимо рассмотреть вопросы адаптации защищенных РСПИ с целью обеспечения требуемой степени защиты и помехоустойчивости передаваемой информации. Применение модификации алгоритма Хургина - Яковлева обеспечивает дополнительную защиту речевой информации в алгоритмах маскирования, а также реализацию алгоритма защиты фонограмм от фальсификаций с возможностью восстановления исходной фонограммы. Необходимо рассмотреть возможности повышения защищенности систем передачи речевой информации за счет использования алгоритмов первичного и помехоустойчивого кодирования.
Для изучения РСПИ на основе модификации алгоритма Хургина -Яковлева необходимо рассмотреть методику проектирования сетей передачи речевой информации на основе предложенного алгоритма, вопросы рационального выбора алгоритма первичного кодирования при передаче речевой информации. На основе предложенных в данной диссертации алгоритмов необходимо рассмотреть вопросы разработки адаптивной системы передачи, обработки и хранения РС с возможной защитой, а также
применения модификации алгоритма Хургина - Яковлева.
Научная проблема: повышение помехоустойчивости и качества восстановленного речевого сигнала, снижение скорости передачи в адаптивных системах обработки и передачи в условиях акустических помех и шумов в радиоканале, а также улучшение защиты от несанкционированного доступа, выявление преднамеренных искажений и восстановление исходной информации при фальсификации.
Объект исследования: адаптивные радиосистемы обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканалах, а также предполагаемого несанкционированного доступа к ним.
Предмет исследования: методы и алгоритмы обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканале.
Цель и задачи работы: разработка адаптивных систем обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканале для повышения помехоустойчивости, робастности к сложной акустической обстановке, улучшения качества и разборчивости передаваемой речевой информации, повышения эффективности использования частотного ресурса, снижения требований к используемым аппаратным средствам за счет уменьшения вычислительных затрат, а также улучшения защиты каналов передачи от несанкционированного доступа.
Поставленная цель работы включает решение следующих задач:
1. Разработать алгоритм параллельной обработки в радиотехнических системах на основе модификации алгоритма Хургина - Яковлева.
2. Рассмотреть вопросы реализации кодеков речевых сигналов в радиотехнических устройствах на основе модификации алгоритма Хургина-Яковлева.
3. Разработать и исследовать алгоритмы обработки речевых сигналов в радиоканале при действии акустических помех и шумов в канале связи.
4. Разработать и исследовать алгоритмы оценки качества речи, наличия голосовой активности и параметров первичного кодека при действии акустических помех и шумов в канале связи.
5. Разработать алгоритмы адаптивной передачи речевых сигналов.
6. Разработать алгоритмы защиты речевых сигналов и восстановления фонограмм от фальсификаций.
7. Осуществить проектирование и реализацию систем и сетей передачи, обработки и хранения информации на основе модификации алгоритма Хургина-Яковлева.
Методы исследования. В данной диссертационной работе использовались методы статистической радиотехники и математической статистики, вариационного и матричного исчисления, вычислительной математики и теории вейвлет-функций. Данные теоретические методы сочетались с экспериментальными исследованиями на основе имитационного моделирования.
Положения диссертационного исследования, выносимые на защиту:
1. Модификация алгоритма Хургина - Яковлева, обеспечивающая выигрыш в помехоустойчивости до 5 дБ при числе каналов обработки от 2 до 4, при этапах разложения от 1 до 3, а также возможности параллельной обработки и снижения вычислительных затрат.
2. Алгоритмы кодирования РС на основе модифицированного алгоритма Хургина-Яковлева, обеспечивающие улучшение качества восстановленной речи от 0,2 до 1 балла согласно ГОСТ Р 50840-95 без снижения скорости передачи, а также уменьшение скорости передачи при незначительном снижении качества речи.
3. Алгоритм комплексной оценки качества речи на выходе первичных кодеков при действии акустических помех и шумов в радиоканале, обеспечивающий соответствие с объективной оценкой с точностью до 0,5 балла согласно ГОСТ Р 50840-95.
4. Алгоритмы адаптации первичных кодеков РС, обеспечивающие адаптацию скорости передачи при изменении вида и мощности акустических шумов за счет выбора алгоритма кодирования и его параметров.
5. Алгоритмы адаптации первичных кодеков, обеспечивающие возможность уменьшения влияния шумов в канале связи, при незначительном увеличении скорости передачи (не более 20.30 %).
6. Алгоритм совместного маскирования и защиты фонограмм от фальсификаций на основе модификации алгоритма Хургина - Яковлева,
обеспечивающий дополнительную криптостойкость от 106 до 109 ключей, уменьшение остаточной разборчивости маскированной речи до 0,5 балла согласно ГОСТ Р 50840-95, а также возможность обнаружения фальсификаций фонограмм и их восстановления.
Научная новизна. В рамках диссертационной работы получены следующие новые научные результаты.
1. Предложена модификация алгоритма Хургина - Яковлева, обеспечивающая точность восстановления РС при количестве каналов N=2, более простую реализацию синтезирующих фильтров, параллельную обработку сигналов, а также выигрыш в помехоустойчивости.
2. Рассмотрены возможности реализации банков фильтров на основе модификации алгоритма Хургина - Яковлева при двухканальной системе N=2 и трехэтапной обработке, что обеспечит выигрыш в количестве вычислительных операций при реализации алгоритма БПФ Кули - Тьюки по сравнению с аналогичными системами на основе теоремы В.А. Котельникова.
3. Рассмотрены реализации первичных кодеков РС на основе модификации алгоритма Хургина - Яковлева. Показано, что применение данного представления позволяет уменьшить шумы квантования, а также воздействие помех и искажений на каналы отсчетов прореженных сигналов и производной.
4. Проведены исследования влияния акустических помех и шумов в радиоканале на качество речи на выходе первичных кодеков на основе теоремы В.А. Котельникова и модификации алгоритма Хургина - Яковлева. Выделены алгоритмы первичного кодирования, обеспечивающие наилучшее качество восстановленной речи в отдельных скоростных диапазонах.
5. Разработаны и исследованы алгоритмы уменьшения влияния помех и искажений в радиоканале, а также акустических помех на основе теоремы В.А. Котельникова и модификации алгоритма Хургина - Яковлева, и алгоритмы восстановления РС по спектральным отсчетам в низкоскоростных кодеках на основе итерационных методов, и осуществлена их регуляризация.
6. Предложены алгоритмы оценки качества речи на основе метода изменения спектральной динамики, а также комплексного алгоритма оценки
качества речи, обеспечивающие корреляцию полученной объективной оценки с усредненной субъективной оценкой.
7. Обоснован двухэтапный комплексный алгоритм определения голосовой активности. Показано, что применение данного алгоритма обеспечит более точное выделение границ пауз.
8. Предложены алгоритмы оценки параметров первичного кодирования, обеспечивающие определение основных алгоритмов первичного кодирования.
9. Предложены алгоритмы адаптации первичных кодеков речи к акустическим помехам на основе определения параметров акустических помех в паузах РС.
10. Предложены алгоритмы адаптации первичного и помехоустойчивого кодеков к искажениям и пропаданиям блоков отсчетов в радиоканале.
11. Предложены алгоритмы адаптации первичного кодека к условиям распространения и темпу речи диктора. Показано, что применение данного алгоритма обеспечивает улучшение качества восстановленной речи в низкоскоростном кодеке при увеличенном темпе диктора.
12. Предложены алгоритмы маскирования РС на основе модификации алгоритма Хургина - Яковлева во временной и спектральной областях, обеспечивающие дополнительную криптостойкость, а также уменьшение остаточной разборчивости маскированного РС.
13. Предложен алгоритм защиты фонограмм от фальсификаций на основе модификации алгоритма Хургина - Яковлева, обеспечивающий обнаружение фальсификаций типа «вставка ложного фрагмента» и «удаление истинного фрагмента», определение фальсификации фонограммы, восстановление фальсифицированного фрагмента.
14. Предложен адаптивный алгоритм защиты РС, осуществляющий адаптацию к акустическим помехам и шумам в канале связи, скорости
передачи, а также к требованиям к защищенности передаваемой информации.
15. Разработаны методики выбора первичных кодеков при действии акустических помех и шумов в канале связи, обеспечивающие многокритериальный выбор первичного кодека для различных радиосистем передачи информации.
Практическая ценность работы. Представленные в диссертационной работе методы и алгоритмы обработки с использованием отсчетов сигнала и его производной могут использоваться в помехоустойчивых устройствах передачи и обработки информации. Реализация результатов исследований позволит повысить технические характеристики устройств обработки и передачи сигналов для обеспечения улучшения показателей качества функционирования систем обработки и передачи речевых сигналов. Реализация результатов работы позволит снизить чувствительность результатов работы к влиянию помех и искажений.
Новизна научного исследования состоит в разработке адаптивной РСПИ к АП и шумам в радиоканале на основе модификации алгоритма Хургина -Яковлева не только за счет анализа качества речевых сигналов на выходе передающей части системы, но и на выходе приемной части системы, что позволяет учесть воздействие шумов и искажений, а также перегрузок в радиоканале.
В рамках данной диссертационной работы предложена структура системы передачи, обеспечивающая адаптацию первичного и помехоустойчивого кодера для уменьшения влияния АП, а также шумов и искажений в радиоканале. На основе оценки качества в приемной и передающей части системы передачи с помощью разработанных ранее алгоритмов предлагается осуществить выбор наиболее рационального сочетания первичного кодека речевых сигналов и помехоустойчивого кодека, обеспечивающих максимально возможное качество речи на выходе
системы передачи. Кроме того, для защищенных систем предложен адаптивный алгоритм управления параметрами первичного кодека, маскиратора и помехоустойчивого канального кодера, обеспечивающего необходимый уровень защиты речи в радиоканале при максимальной помехоустойчивости и качестве восстановленной речи при действии помех и искажений в радиоканале.
Реализация и внедрение результатов диссертационной работы Исследования по тематике диссертационной работы велись в рамках следующих НИР:
1. В рамках хоздоговорной НИР «Многокритериальный синтез реализуемых сигналов и устройств обработки с учетом мешающих факторов в информационно-телекоммуникационных системах» - исполнитель.
2. В рамках хоздоговорной НИР «Разработка предложений по выбору рациональных принципов построения, технических требований к системам и средствам управления КА НСЭН и контроля запусков средств выведения» -исполнитель.
3. В рамках хоздоговорной НИР «Исследование и разработка принципов построения и технических решений при создании нового поколения НС КИС с учетом помеховой обстановки» - исполнитель.
4. В рамках хоздоговорной НИР «Анализ результатов проведенных исследований в обеспечение выполнения требований ТТЗ по ОКР "Топаз" (разработка материалов ЭП) ("Топаз-РГРТУ")» - исполнитель.
5. В рамках хоздоговорной НИР «Разработка теории и быстрых алгоритмов анализа-синтеза сложных сигналов на основе адаптивного вейвлет-пакетного разложения и многоскоростной обработки в информационно-телекоммуникационных системах» - исполнитель.
6. В рамках хоздоговорной НИР 14-02 «Разработка алгоритмов многокритериального синтеза реализуемых сигналов и устройств обработки» - исполнитель.
7. В рамках хоздоговорной НИР 41-04 «Исследование, моделирование и разработка алгоритмов синтеза и обработки широкополосных сигналов с адаптацией к помеховой обстановке для систем спутниковой связи и передачи информации» (шифр «Вейвлет -1») - исполнитель.
8. В рамках хоздоговорной НИР 11-06 «Анализ современного состояния проблемных вопросов устойчивости радиолиний к естественным и преднамеренным помехам при передаче интегрированных цифровых информационно-управляющих потоков» (шифр «Поток-РГРТА») -исполнитель.
9. В рамках хоздоговорной ОКР 27-06 «Разработка материалов эскизного проекта в части проработки перспективных методов волновых преобразований и адаптивных алгоритмов в СК» - исполнитель.
10. В рамках госбюджетной НИР 6-07Г «Разработка теории и быстрых алгоритмов анализа-синтеза сложных сигналов на основе адаптивного вейвлет-пакетного разложения и многоскоростной обработки в информационно-телекоммуникационных системах (по программе «Развитие научного потенциала высшей школы» (2006 - 2008 годы))» - ответственный исполнитель.
11. В рамках хоздоговорной НИР 4-07 «Исследование методов повышения помехоустойчивости КПРЛ унифицированной бортовой и наземной перспективной КИС нового поколения, функционирующей как в непосредственном, так и в ретрансляционном режимах высокоскоростного обмена с КА» - исполнитель.
12. В рамках хоздоговорной НИР 11 -07 «Описание существующих подходов к формированию сигналов командно-программной информации и измерения ТНП на основе анализа технологий управления зарубежными СТС» - исполнитель
13. В рамках хоздоговорной НИР 27-07 «Разработка технических решений при создании нового поколения НС КИС с учетом помеховой обстановки» -исполнитель
14. В рамках хоздоговорной НИР 7-08 «Разработка принципов создания, моделей функционирования для обоснования технических характеристик систем и средств управления КА НСЭН и контроля запусков» (шифр «Поток») - исполнитель.
15. В рамках хоздоговорной НИР ФЦП 32-09 «Современные программно-аппаратные алгоритмы обработки для радиолиний передачи интегрированных цифровых информационно-управляющих потоков космических аппаратов научного и социально-экономического назначения» -ответственный исполнитель.
16. В рамках хоздоговорной НИР 18-10 «Разработка предложений по обеспечению устойчивости радиолиний к естественным и преднамеренным помехам, при передаче интегрированных цифровых информационно-управляющих потоков, для модернизируемых и перспективных РКН и КА НСЭН» - исполнитель.
17. В рамках хоздоговорной НИР 22-10 «Исследование перспективных методов моделирования движения космических аппаратов, предсказания траектории движения и алгоритмов распознавания типов наблюдаемых космических объектов. ФЦП НИР» - исполнитель.
18. В рамках хоздоговорной НИР 44-10 «Разработка перспективных методов и алгоритмов синтеза и оценки параметров сигнала в сложной сигнально - помеховой обстановке промышленных систем управления по соответствующим показателям качества ФЦП» - исполнитель.
19. В рамках хоздоговорной НИР 36-10 «Создание автоматизированной базы данных для исследования акустической среды звукозаписи» -ответственный исполнитель.
20. В рамках хоздоговорной НИР 4-10 Г «Методы и алгоритмы помехозащищенной передачи и обработки информации в современных информационно-телекоммуникационных системах» - ответственный исполнитель.
21. В рамках хоздоговорной ОКР 13-10 «Разработка компонентов специального программного обеспечения КИМС в части комплексов программ оптимизации параметров воздействия заданных помех на известные и новые виды полезного радиосигнала систем спутниковой связи и формирования основных видов помех по результатам оценки их эффективности» - исполнитель.
22. В рамках хоздоговорной НИР 36-10 «Создание автоматизированной базы данных для исследования акустической среды звукозаписи» -ответственный исполнитель.
23. В рамках хоздоговорной НИР 51-10 «Разработка и исследования алгоритмов аппаратурной оценки качества слухового восприятия речи на фоне помех в каналах связи с низкоскоростным кодированием» -ответственный исполнитель.
24. В рамках хоздоговорной НИР 27-11 «Реализация алгоритмов формирования и обработки интегрированных цифровых информационно -управляющих потоков, алгоритмов повышения информативности радиолиний передачи, интегрированных цифровых информационно-управляющих потоков и алгоритмов совместного кодирования и формирования сигналов» (шифр «Телеприбор-РГТРУ») - ответственный исполнитель.
25. В рамках хоздоговорной НИР 52-11 «Разработка автоматизированной системы подводной оптической связи для управления мобильными роботизированными комплексами по стандартам радиосвязи нового поколения с целью обеспечения надежности и безопасности их применения в подводных условиях» - ответственный исполнитель.
26. В рамках гранта Президента РФ 16-11 Г «Методы и алгоритмы передачи интегрированных цифровых информационно-управляющих потоков для адаптивных к помеховой обстановке средств управления космическими аппаратами научного и социально-экономического назначения» (МК-2775.2011.8) - руководитель.
27. В рамках госбюджетной НИР 9-12 Г «Разработка теории и алгоритмов помехозащищенной передачи и повышения информативности радиолиний, интегрированных цифровых информационно-управляющих потоков в бортовых и наземных командно-информационных комплексах для модернизируемых и перспективных космических аппаратов» -ответственный исполнитель.
28. В рамках хоздоговорной НИР 8-12 «Разработка предложений по обеспечению устойчивости радиолиний к естественным и преднамеренным помехам, при передаче интегрированных цифровых информационно-управляющих потоков, для модернизируемых и перспективных РКН и КА НСЭН» (шифр «Телеприбор-РГТРУ») - ответственный исполнитель.
29. В рамках хоздоговорной НИР № 20-12 «Модернизация программного кодека АДИКМ речевого сигнала» (шифр «Язык-ПО») - исполнитель
30. В рамках госбюджетной НИР ФЦП 36-12Г «Алгоритмы и методы проектирования универсального блока формирования и обработки широкого класса радиосигналов перспективных спутниковых систем передачи информации» - ответственный исполнитель.
31. В рамках госбюджетной НИР 6-12Г «Методика проектирования универсального программно-управляемого блока сжатия видеоинформации и модуляции радиосигналов в перспективных помехоустойчивых космических линиях передачи информации» - ответственный исполнитель.
32. В рамках госбюджетной НИР ФЦП НИР 38-12Г «Разработка методов и алгоритмов повышения информативности, помехоустойчивости и защиты радиолиний передачи интегрированных цифровых потоков в бортовых и
наземных командно-информационных комплексах спутниковых систем связи» - исполнитель.
33. В рамках госбюджетной НИР ФЦП НИР 39-12Г «Разработка многофункционального блока, адаптивного к сигнально-помеховой обстановке формирования и обработки радиосигналов промышленных систем управления» - исполнитель.
34. В рамках госбюджетной НИР ФЦП НИР 40-12Г «Разработка высокоэффективных алгоритмов сжатия цифровых видеоданных на основе вейвлет-пакетного разложения и математической модели предсказания вектора движения для обеспечения более быстрого доступа к широкополосным мультимедийным услугам» - исполнитель.
35. В рамках хоздоговорной НИР 17-13 «Формулировка требований к параметрам помеховых сигналов, формируемых в приемной аппаратуре, на основе анализа радиотехнических параметров сигнала заданной моделью радиолинии» (шифр «Пелена-РГРТУ») - исполнитель.
36. Госбюджетная НИР 9-16Г в рамках совместного гранта Российского фонда Фундаментальных исследований (РФФИ) и Рязанской области 16-47620544 "Методы объективной оценки качества речевых сигналов и подавления акустических помех в информационно-телекоммуникационных системах Рязанской области" - ответственный исполнитель.
37. Госбюджетная НИР 1-20Г в рамках гранта Российского фонда Фундаментальных исследований (РФФИ) 20-07-00783 "Перспективные инфокоммуникационные технологии, методы и алгоритмы формирования и обработки сигналов для защищенных и помехоустойчивых систем передачи информации на принципах когнитивного и программно-определяемого радио (SDR)" Заказчик РФФИ - руководитель.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Автоматическая оценка качества передачи речевого сигнала по цифровым каналам связи на примере системы связи стандарта GSM2006 год, кандидат технических наук Решетников, Виктор Владиславович
Модели и методы анализа и обработки речевого сигнала в системах связи2018 год, кандидат наук Афанасьев, Андрей Алексеевич
Анализ и синтез адаптивных устройств помехозащиты в радиолиниях с широкополосными шумоподобными сигналами, входящих в состав радиолокационных комплексов2011 год, кандидат технических наук Харитонов, Андрей Сергеевич
Повышение помехоустойчивости передачи цифровой информации по сетям связи Республики Ангола2015 год, кандидат наук Гомес Жилберто Лоуренсо
Алгоритмы обработки речевых сигналов телекоммуникационных систем в условиях помех2022 год, кандидат наук Холкина Наталья Евгеньевна
Список литературы диссертационного исследования доктор наук Дмитриев Владимир Тимурович, 2023 год
- - Ф1
ДКЫ-1 ТМ Фм-1 + ¿Ы
... ф2
¿Ы
¿Ы Фт»-1. + ¿М ФЫ
к
¿М
Рисунок 1.27 -Структурная схема МАХЯ при Т-кратном разложении исходного сигнала и N каналах обработки 1.4.2 Оценка помехоустойчивости двухэтапного и трехэтапного разложения
Произведем оценку помехоустойчивости двухэтапного и трехэтапного разложения согласно предложенному алгоритму при различном числе каналов обработки N=2, 3, 4. Вычисления помехоустойчивости систем обработки сигналов приведены в приложении А. Выигрыш помехоустойчивости для систем обработки при использовании МАХЯ по сравнению с аналогичной системой обработки на основе теоремы В.А. Котельникова приведен в таблице 1.3.
Таблица 1.3 - Выигрыш помехоустойчивости для МАХЯ при различном числе каналов
Т ЭТАП
1 ЭТАП
1 ЭТАП
Т ЭТАП
+
КС
Д Ы-1
Кт(Ы-1)
Д
ДКтЫ
Количество этапов представления Хургина - Яковлева N=2 N=3 N=4
Одноэтапная процедура 2,273 3,148 6,5
Двухэтапная процедура 4,547 6,285 13,03
Трехэтапная процедура 6,819 9,428 19,53
В таблице 1.4 показаны ошибки восстановления РС в дБ при реализации МАХЯ.
Таблица 1.4 - Ошибки восстановления для МАХЯ
Этапность процедуры N=2 N=3 N=4
Одноэтапная процедура 300.290 23.26 18.23
Двухэтапная процедура 295.287 18.15 5.3
Трехэтапная процедура 290.285 7.5 1.-2
Как видно из таблиц 1.3 и 1.4, с ростом количества этапов, так же, как и с ростом числа каналов, алгоритмы обработки сигналов, построенные на основе МАХЯ, обеспечивают возрастание помехоустойчивости по сравнению с аналогичными системами обработки на основе теоремы В.А. Котельникова. В то же время с ростом данных параметров увеличиваются ошибки восстановления сигнала за счет умножения ошибок, вызванных неточностью определения ФЧХ, аппроксимации АЧХ и неточности определения производной. Поэтому для точной обработки сигналов возможно применять предложенный алгоритм по двухканальной схеме при использовании двукратного и трехэтапного разложения. Ошибка при использовании трехэтапного разложения - не ниже 60.80 дБ, что достаточно для цифровой обработки РС и многих других видов сигналов. В низкоскоростных системах передачи РС, где ошибка 15.20 дБ считается допустимой, возможно использовать двукратное и трехкратное представление МАХЯ при числе каналов N=3 и N=4.
1.5 Реализация банков фильтров на основе модификации алгоритма
Хургина - Яковлева
Банки фильтров являются многоскоростными системами, в которых частота дискретизации различна в различных точках [46]. Неотъемлемой частью таких систем являются устройства изменения частоты дискретизации - дециматоры и интерполяторы. Обобщенная структурная схема системы обработки на основе банков фильтров показана на рисунке 1.28. Схемы включения интерполяторов и дециматоров (рисунок 1.29) позволяют уменьшить число вычислений в банке фильтров.
x(n) Ho (Z) ^N
Hl (Z)
^N Fo (Z)
^N Fl (Z)
Hn-1 (Z) ^N
^N FN (Z)
X(n)
Рисунок 1.28 - Обобщенная схема системы обработки на основе банков
фильтров
Рисунок 1.29 -Эквивалентные схемы включения фильтров-дециматоров и фильтров-интерполяторов
Это обусловлено тем, что частота дискретизации входного сигнала снижается при помощи дециматора, а затем осуществляется процесс фильтрации, таким образом, общая вычислительная сложность уменьшается пропорционально коэффициенту децимации. В каждом канале банка фильтров после окончания обработки субполосного сигнала частота дискретизации повышается при помощи интерполятора. Данные равенства (эквивалентные схемы включения) широко применяются для вывода различных соотношений [47]. Таким образом, применение интерполяторов и дециматоров позволяет сократить сложность обработки и за счет распараллеливания вычислений получить выигрыш при реализации ряда операций обработки сигнала. Как видно из структурных схем систем обработки, приведенных на рисунках 1.1, 1.3, 1.6, предложенный алгоритм также обеспечивает многоскоростную обработку. Таким образом, с учетом определения банков фильтров предложенный алгоритм обеспечивает
¿N
аналогичное банкам фильтров разложение сигнала. При этом предложенный алгоритм при различном числе каналов и глубине разложения легко реализовать на основе банков фильтров. Небольшим различием данных систем является то, что банки фильтров работают с различными частотными диапазонами, а предложенный алгоритм работает с производными и сигналами. В состав систем обработки на основе МАХЯ входят интерполяторы и дециматоры, а также можно выделить блоки анализа и синтеза. В составе блока анализа для реализации МАХЯ присутствуют дифференцирующие устройства и дециматоры, а в блоке синтеза -интерполяторы и синтезирующие фильтры. При этом использование МАХЯ
для N=2 дает выражения для блока анализа для двух каналов: И0(2) = 1 • ,
И (2) = 2 • вл'2. Для блока синтеза выражения для синтезирующих фильтров
имеет следующий вид:
(г) = Ф1(I) = А1(п) • е0, ^(2) = Ф2(I) = А2(п) • елП. (1.39)
На рисунке 1.30 представлена обобщенная схема реализации МАХЯ на основе банков фильтров.
Рисунок 1.30 - Схема реализации МАХЯ на основе банков фильтров
При использовании двухэтапного и трехэтапного преобразования МАХЯ возможно использование конвейерного преобразования на основе банков фильтров [48.49]. Таким образом, предложенный алгоритм при реализации в виде банков фильтров обеспечивает возможности сокращения вычислительных затрат при обработке сигналов. Рассмотрим вычислительные затраты в устройствах кодирования и асинхронного
маскирования на основе МАХЯ при реализации на основе банков фильтров и проведем их сравнение с вычислительными затратами в аналогичных системах. Для анализа используем в качестве примера наиболее часто применяющуюся в системах обработки сигналов процедуру вычисления БПФ Кули - Тьюки. Для выполнения алгоритма БПФ Фурье Кули - Тьюки по К отсчетам требуется общее количество вычислительных операций: Мк - К ■ log2(K) . (140)
При реализации обработки на предложенном алгоритме при N=2 выполняется два быстрых преобразования Фурье для К/ 2 отдельных ДОС и ДОП. При этом общее количество операций для обработки на основе МАХЯ составит М :
МХ2 = К/2 • log2 К/2 + К/2 • log2 К/2 = К • log2 К/2 . (1.41)
Относительный выигрыш вычислительных затрат в БПФ Кули - Тьюки для систем с применением МАХЯ при двухканальной системе обработки N=2 относительно алгоритмов обработки на основе теоремы В.А. Котельникова можно оценить по формуле:
Мох 2 = М- = = ^ = ^og к/2 К. (1.42)
Мх 2 К • log, К log2 К
Таким образом, количество операций для обработки на основе МАХЯ при N-канальной системе обработки:
Мж = К/N • log2( К / N) + К/N • log2( К / N) +... + К / N • log2( К / N) = К • log^ / N ).(1.43) Относительный выигрыш вычислительных затрат в БПФ Кули - Тьюки для систем на основе МАХЯ при произвольном числе каналов N относительно алгоритмов обработки на основе теоремы В.А. Котельникова можно оценить по формуле:
_МК_ К • log2К _ log2К MOXN - — - К - l0gк . (1.44)
М™ К • log2 К log2 К
На рисунке 1.31 показан относительный выигрыш в количестве вычислительных операций для БПФ Кули - Тьюки на основе МАХЯ при количестве каналов N=2, 3, 4, изображенных на зависимостях под цифрами 1, 2, 3 соответственно.
1-----:-
О 200 4-00 600 800 К1
Рисунок 1.31 - Относительный выигрыш в количестве вычислительных операций для БПФ Кули-Тьюки МАХЯ при количестве каналов N=2.4
В случае использования повторного и тройного разложения количество каналов обработки увеличивается. В случае N канальной системы при степени разложения Ъ общее количество каналов можно определить по формуле: N = ^. Таким образом, при двухканальной системе N^2 и двукратном разложении количество каналов составит 4, а при четырехканальной системе М=4 и трехкратном разложении количество каналов составит 64. Для многократного разложения количества операций для N - канальной системы обработки на основе МАХЯ количество вычислительных операций для БПФ Кули - Тьюки можно записать по формуле:
мж = Кщ ■ ^(К/) +... + К/N ■ ^(К/) = К■ ^(К/). (1.45)
Относительный выигрыш вычислительных затрат в БПФ Кули - Тьюки для систем на основе МАХЯ при произвольном числе каналов N
относительно алгоритмов обработки на основе теоремы В.А. Котельникова можно оценить по формуле:
МК
М - К
К • К К
охы М „ , К , К М ™ К • ^^ 1ов
= 1о§к/мгк •
(1.46)
2 N
На рисунках 1.32 и 1.33 показан относительный выигрыш в количестве вычислительных операций для БПФ Кули - Тьюки МАХЯ при двухэтапном и трехэтапном разложении и при количестве каналов N=2, 3, 4, изображенных на зависимостях под цифрами 1, 2, 3 соответственно. На графиках, на рисунке 1.32 показан относительный выигрыш вычислительных затрат для алгоритма Кули - Тьюки: 1 - для двухэтапного разложения согласно предложенному алгоритму при количестве каналов два - МХ2*2, 2 -для двухэтапного разложения согласно предложенному алгоритму при количестве каналов три - Мхзл,3 , 3 - для двухэтапного разложения согласно предложенному алгоритму при количестве каналов четыре - М .
Рисунок 1.32 - Относительный выигрыш в количестве вычислительных операций для БПФ Кули - Тьюки на основе МАХЯ
На графиках на рисунке 1.33 показан относительный выигрыш вычислительных затрат для алгоритма Кули - Тьюки: 1 - для трехэтапного разложения согласно предложенному алгоритму при количестве каналов два
- МХ2*2Я,2, 2 - для трехэтапного разложения согласно предложенному алгоритму при количестве каналов три - Мхзя,3*3, 3 - для трехэтапного разложения согласно предложенному алгоритму при количестве каналов четыре - МХ4*4Я,4. В таблице 1.5 приведено количество операций для обработки на основе модифицированного алгоритма при двухканальной обработке МХ2 , трехканальной обработке Мхз, четырехканальной обработке МХ4, аналогично для двукратного разложения МХ2*2, Мхъ*ъ,
М
X 4*4
, а также для трехэтапного разложения М
X 2*2*2' МХ 3*3*3
, М
X4*4*4
. В
таблице 1.6 приведен относительный выигрыш в количестве вычислительных операций для БПФ Кули - Тьюки МАХЯ при одноэтапном разложении при числе каналов 2 - Мох 2, при одноэтапном разложении при числе каналов 3 -
Мох3, при одноэтапном разложении при числе каналов 4 - Мох4,
двухэтапном разложении при начальном числе каналов 2 - М ,
двухэтапном разложении при начальном числе каналов 3 -М ,
двухэтапном разложении при начальном числе каналов 4 -М , трехэтапном разложении при начальном числе каналов 2 - М
трехэтапном разложении при начальном числе каналов 3 - М , трехэтапном разложении при начальном числе каналов 4 - МОХ4*4>,,4.
при при при при при при
Рисунок 1.33 - Относительный выигрыш в количестве вычислительных операций для БПФ Кули - Тьюки на основе МАХЯ
При обработке РС с частотой дискретизации 8 кГц с учетом длительности квазистационарного участка РС 10.30 мс наиболее часто применяются выборки отсчетов РС 128 и 256. Как следует из анализа зависимостей, приведенных на рисунках 1.31, 1.32, 1.33, а также данных приведенных в таблице 1.6, выигрыш в количестве вычислительных операций при реализации алгоритма БПФ Кули - Тьюки на основе МАХЯ и банков фильтров по сравнению с аналогичными системами на основе теоремы В.А. Котельникова составляет при двухканальной системе N=2 и трехэтапной обработке (при минимальной ошибке) 75 % (при количестве отсчетов 128), общее количество каналов при этом составит 8.
Таким образом, применение банков фильтров на основе МАХЯ позволяет снизить требования к сигнальным процессорам, занимающимся вычислением БПФ, и значительно удешевить реализацию данных кодеков за счет конвейерной схемы обработки.
Таблица 1.5 - Количество операций для МАХЯ
Число отсчетов К=64 К=128 К=256 К=512 К=1024
мк 384 896 2048 4608 10240
МХ 2 320 768 1792 4096 9216
МХ 3 283 693 1642 3796 8617
МХ 2*2 , МХ 4 256 640 1536 3584 8192
М X 3*3 181 490 1236 2985 6994
МX 4*4 128 384 1024 2560 6144
М X2*2*2 192 512 1280 3072 7168
X 3*3*3 80 287 831 2173 5371
М X4*4*4 0 128 512 1536 4096
Таблица 1.6 - Выигрыш количества вычислительных затрат для МАХЯ
Число отсчетов К=64 К=128 К=256 К=512 К=1024
М М ОХ 2 1,2 1,167 1,143 1,125 1,111
М М ОХ 3 1,36 1,293 1,247 1,214 1,188
М ОХ 2*2' М ОХ 4 1,5 1,4 1,333 1,286 1,25
М ОХ 3*3 2,12 1,828 1,656 1,544 1,464
М ОХ 4*4 3 2,333 2 1,8 1,667
М ОХ 2*2*2 2 1,75 1,6 1,5 1,429
М ОХ 3*3*3 4,82 3,118 2,465 2,12 1,907
М ОХ 4*4*4 - 7 4 3 2,5
1.6 Выводы
В первой главе проведена разработка алгоритма параллельной обработки сигналов в радиоканале на основе модификации алгоритма Хургина - Яковлева. Проведенные исследования показали целесообразность использования МАХЯ в обработке и передаче информации с целью снижения порядка синтезирующих фильтров при той же ошибке восстановления сигналов, увеличения помехоустойчивости, а также снижения вычислительных затрат за счет распараллеливания обработки ДОС и ДОП. Анализ результатов, полученных в первой главе, позволяет сделать следующие выводы:
1. Разработана модификация алгоритма Хургина - Яковлева при различном количестве каналов обработки (N=2, 3, 4). Показана возможность точного восстановления РС при двухканальном алгоритме. Получены АЧХ и ФЧХ синтезирующих фильтров для МАХЯ в двухканальном, трехканальном и четырехканальном алгоритме обработки и передачи речевой информации.
2. Показана более простая реализация синтезирующих фильтров на основе модификации алгоритма Хургина - Яковлева, так они имеют меньший уровень боковых лепестков импульсной характеристики. Показано, что реализация синтезирующих нерекурсивных фильтров на основе МАХЯ обеспечивает выигрыш по СКО ц для случайного процесса с равномерным
спектром ^и=(40...60) % при Р=10...100, а для РС - ^р=(0...45) % при Р=40...100 по сравнению с аналогичными фильтрами на основе теоремы В.А. Котельникова.
3. Произведена оценка точности вычисления производных сигнала для различных алгоритмов. Показано, что использование алгоритма получения производной в спектральной области позволит получить минимальные ошибки при восстановлении РС.
4. Произведена оценка помехоустойчивости и точности МАХЯ обработки РС. Показано, что с точки зрения точности предложенный алгоритм при двухканальной реализации N=2 может использоваться для различных кодеков РС, при трехканальной реализации N=3 - для среднескоростных и низкоскоростных кодеков, а при четырехканальной реализации N=4 - только для низкоскоростных кодеков РС. Также показано, что с ростом количества каналов (с 2 до 4) помехоустойчивость алгоритма увеличивается, но возрастают ошибка и сложность реализации.
5. Проведен анализ двухэтапного и трехэтапного разложения РС согласно предложенному алгоритму. Показано, что с ростом количества этапов алгоритмы обработки сигналов, построенные на основе МАХЯ, обеспечивают возрастание помехоустойчивости по сравнению с аналогичными системами обработки на основе теоремы В.А. Котельникова, но в то же время возрастают ошибки восстановления. Поэтому для точной обработки сигналов возможно применять предложенный алгоритм по двухканальной схеме при использовании двукратного и трехэтапного разложения. Ошибка при использовании трехэтапного разложения при этом не ниже 60.80 дБ, что достаточно для цифровой обработки РС и многих других видов сигналов.
6. Исследован выигрыш в количестве вычислительных операций для МАХЯ по сравнению с классическим. Применение банков фильтров на основе МАХЯ позволяет снизить требования к сигнальным процессорам и
значительно удешевить реализацию данных кодеков за счет конвейерной схемы обработки.
2 РЕАЛИЗАЦИЯ КОДЕКОВ РЕЧЕВЫХ СИГНАЛОВ В РАДИОТЕХНИЧЕСКИХ УСТРОЙСТВАХ НА ОСНОВЕ МОДИФИКАЦИИ АЛГОРИТМА ХУРГИНА - ЯКОВЛЕВА 2.1 Вводные замечания
Современный уровень развития систем и сетей передачи информации открывает новые возможности по дальнейшему совершенствованию методов первичного кодирования РС, призванных существенно повысить эффективность РСПИ [50.54]. Основным требованием к алгоритмам кодирования РС является сокращение избыточности РС с помощью различных алгоритмов кодирования для обеспечения необходимого для потребителей качества принятой речи (КПР) на выходе системы передачи, а также высокой помехоустойчивости при воздействии различных АП, шумов и искажений в радиоканале [55].
Большинство современных алгоритмов кодирования РС в своем составе содержат предсказатель, поэтому в рамках данной работы целесообразно рассмотреть модификацию наиболее простого алгоритма первичного кодирования на основе предсказателя - адаптивной дифференциальной импульсно -кодовой модуляции (АДИКМ) [56]. Результаты. Полученные в диссертационной работе, могут быть распространены на более широкий класс алгоритмов первичного кодирования РС, использующих предсказатель. К таким алгоритмам также относятся алгоритмы CELP' MELP.
Получившие в последнее время широкое распространение в низкоскоростных системах обработки РС вокодеры и полувокодеры хотя и обеспечивают приемлемую разборчивость, но не позволяют получить хорошее КПР [57.63]. Для улучшения КПР в полосовом вокодере и увеличения скорости обработки также возможно использование обработки и передачи РС на основе МАХЯ. Это позволяет при практической реализации синтезирующих фильтров в виде цифровых нерекурсивных фильтров
получить меньшую ошибку восстановления сигналов и более высокое КПР на выходе вокодера, а также дополнительно увеличить его помехоустойчивость [64.67]. Для дальнейшего увеличения КПР в вокодерах на основе МАХЯ возможно использование итерационных алгоритмов восстановления и метода регуляризации, позволяющих учесть не только текущие, но и априорные характеристики РС. Данные алгоритмы позволят использовать априорные данные о классе возможных решений, что устранит нестационарное размытие, а также обеспечит высокую функциональную устойчивостью к ошибкам аппроксимации. Другой важной проблемой, которая возникает в низкоскоростных кодеках, является выбор новых представлений РС, позволяющих более эффективно выделять параметры, наиболее точно описывающие РС в низкоскоростных системах связи. На основе МАХЯ возможна реализация комплексного представления, когда прореженный РС или его спектр может быть совмещен с ДОП или ее спектром. Также необходимо рассмотреть возможности параллельного кодирования ДОС и ДОП с помощью различных алгоритмов низкоскоростного кодирования. Также на основе МАХЯ возможна реализация алгоритма смены плоскостей амплитуда-время для коротких кадров РС, что обеспечит возможности увеличения помехоустойчивости передаваемой информации.
Вейвлет-пакетное разложение (ВПР) сигналов получило широкое распространение при обработке и кодировании РС. По своей структуре ВПР так же, как и представление МАХЯ, имеет свою глубину и различное число каналов на входе. Вызывает интерес совместное применение ВПР и МАХЯ с точки зрения снижения скорости передачи в известных алгоритмах кодирования РС.
С учетом вышеизложенных соображений во второй главе работы для реализации первичных кодеков РС на основе МАХЯ необходимо решить следующие задачи:
1. Исполнение кодеков РС на основе МАХЯ.
2. Исполнение кодеков РС на основе ВПР и МАХЯ.
3. Разработка алгоритма передачи РС в комплексном виде на основе МАХЯ.
4. Исполнение кодеков РС на основе метода смены плоскостей и МАХЯ.
2.2 Реализация кодеков речевых сигналов на основе модификации алгоритма Хургина - Яковлева 2.2.1 Модификация кодеков формы
Исследования кодеков РС проводились методами имитационного моделирования с целью анализа влияния шумов квантования и АП на кодеки, реализованные на основе МАХЯ. Осуществлялось их сравнение с кодеками, реализованными на основе теоремы В.А. Котельникова. Экспериментальные исследования проводились на установке, включающей: микрофон МД-85, микрофонный усилитель, 12-разрядные АЦП и ЦАП, ПЭВМ усилитель мощности и акустическую систему. При экспериментальных исследованиях использовались различные слова и фразы, предусмотренные ГОСТ Р 5084095, произнесенные 20 дикторами. Общий массив слов и фраз составлял более 30 словосочетаний. Для каждого диктора использовалось усреднение по выборке, состоящей из 1000 сегментов РС длительностью 16 мс каждый [68.71]. В качестве критерия эффективности работы кодека использовались рекомендованная МККТТ оценка субъективного КПР и ОСШ квантования, усредненные по дикторам и слушателям при заданной скорости передачи. Методика проведения эксперимента соответствовала ГОСТ Р 50840 -95. Общая скорость передачи в системах на основе МАХЯ складывается из скорости передачи ДОС и ДОП:
С = В К + В К , бит/с, (2.1)
с д.с п д.п у у чу
где В и В - разрядность представления ДОС и ДОП соответственно, Ед с, Рдп - частота дискретизации ДОС и ДОП. Для сигнала и производной использовалась частота дискретизации = = 4 кГц. В данном случае
ДОС и ДОП квантуются с одинаковой разрядностью с помощью основных алгоритмов кодирования Вс = Вп. В работах [72.78] рассмотрены кодеки на основе импульсно-кодовой модуляции (ИКМ), адаптивной импульсно-кодовой модуляции (АИКМ), реализованных на основе теоремы В.А. Котельникова и МАХЯ. Разность ОСШ квантования для алгоритмов, реализованных на основе теоремы В.А. Котельникова, и модифицированного алгоритма близка к рассчитанным в первой главе значениям [79.81]. По сравнению с системами передачи речевой информации, основанными на теореме В. А. Котельникова, предложенный алгоритм позволяет добиться выигрыша в ОСШ порядка 2,5 дБ в системе АДИКМ с фиксированным предсказателем (АДИКМ-ФП) начиная со скорости передачи 56 кбит/с. На рисунке 2.1 показано, что возможно добиться выигрыша в ОСШ квантования Дq при применении МАХЯ по сравнению с аналогичными кодеками на основе теоремы В.А. Котельникова (кривая 2 -ц-компандер, кривая 3 -система АИКМ со скоростью передачи 56 кбит/с, кривая 4 - АДИКМ - ФП) [82]. Использование модифицированного алгоритма совместно с ИКМ с А-компандером при скорости 64 кбит/с позволит добиться выигрыша в ОСШ квантования на 0,5 дБ [83].
Рисунок 2.1 - Выигрыш в ОСШ квантования от скорости кодека на
основе МАХЯ
2.2.2 Модификация кодека АДИКМ на основе модификации алгоритма Хургина - Яковлева при наличии шумов квантования и акустических помех
Для практического использования наибольший интерес представляют исследования кодека АДИКМ с точки зрения минимизации шумов квантования. Исследовались системы АДИКМ на основе МАХЯ с передачей параметров (ПП), с оценкой параметров предсказания (ОП) на приемной стороне и с ФП, а также проведено их сравнение с аналогичными кодеками на основе теоремы В.А. Котельникова [84]. На передачу коэффициентов предсказания кодека АДИКМ отводится 1.2 кбит/с, а на сигнал остатка предсказания - 4.60 кбит/с (в зависимости от исследуемой скорости передачи). Доверительные интервалы зависимостей КПР и разборчивости восстановленного сигнала, рассчитанные для 1000 оценок с вероятностью 99 %, составляют 0,01.0,025 балла для различных выборок РС на выходе исследуемых кодеков. Доверительный интервал для оценки зависимости ОСШ квантования, рассчитанный с вероятностью 99 %, не превышал 0,05 дБ для всех рассчитанных зависимостей. В кодерах АДИКМ, в основу которых положено представление РС на основе МАХЯ, необходима отдельная оценка коэффициентов предсказания ДОС и ДОП, что нецелесообразно с точки зрения вычислительных затрат. Рассмотрим метод определения коэффициентов предсказания канала ДОП по его автокорреляционной функции сигнала. Это позволит уменьшить общие вычислительные затраты, используемые на вычисление автокорреляционной функции производной. Уравнение Юла - Уокера для вычисления коэффициентов предсказания аш. производной РС имеет вид [85]:
м
(2.2)
1=1
где к е[0;71], Y1 -порядок предсказания, R (к) - автокорреляционная
функция производной РС. Автокорреляционная функция производной РС имеет вид:
Rn(i) = Kn(i) ® R(i), (2.3)
а уравнение Юла - Уокера для производной РС примет следующий вид:
M
£• Kn(|i - j\) ® R(|i - j\) = -R(j) ® K(j). (2.4)
i=i
Коэффициенты предсказания производной могут быть получены как решение приведенной выше системы линейных уравнений. Исходя из анализа полученных зависимостей предложена реализация АДИКМ на основе МАХЯ, структурная схема которого изображена на рисунке 2.2, где с помощью пунктирных линий показаны системы с передачей параметров и оценкой параметров предсказания на приемной стороне, где П -предсказатель, А и АП - система адаптации квантователя и предсказателя, КВ - квантователь, ДК - декодер. Как видно из анализа предложенной структурной схемы, применение МАХЯ, при уменьшении порядока и совмещении адаптации предсказателя для сигнала и производной в общем блоке, позволяет сократить вычислительные затраты для систем АДИКМ. Как следует из анализа реализаций автокорреляционных функций сигнала (приложение Б, рисунок Б.1) и его производной (приложение Б, рисунок Б.2), отсчеты производной РС менее коррелированы по сравнению с отсчетами РС.
а б
Рисунок 2.2 - Структурная схема кодера и декодера АДИКМ на основе
МАХЯ
Это уменьшает требования, предъявляемые к предсказателю производной, и позволяет уменьшить порядок данного предсказателя. Рассмотрим зависимости выигрыша в ОСШ квантования на выходе кодеков на основе МАХЯ, по сравнению с аналогичными системами на основе теоремы В.А. Котельникова, оцененного по формуле: Q = ЦвыхХЯ - ЯвыхК, от
скорости передачи для различных систем АДИКМ (приложение Б, рисунок Б.3, АДИКМ-ПП, АДИКМ-ОП и АДИКМ-ФП). Как следует из анализа приведенных зависимостей, в системе АДИКМ с ФП выигрыш наибольший и достигает 2,5 дБ начиная со скорости передачи 56 кбит/с и ниже. С целью дальнейшего увеличения ОСШ проведено исследование оптимальных порядков предсказателя для сигнала и производной в системе АДИКМ с ФП. В приложении Б на рисунке Б.4 показана зависимость ОСШ на выходе системы АДИКМ с ФП от порядка предсказателя производной при скорости передачи 32 кбит/с, при суммарном порядке предсказателя, равном 6. Из
приведенных зависимостей можно сделать вывод, что оптимальным является порядок предсказателя для производной, равный 2, а для сигнала - 4. Такой предсказатель обеспечивает ОСШ на 0,5 дБ выше, чем предсказатель с порядком 3+3. Аналогичные результаты получены и для других систем АДИКМ на основе МАХЯ. Таким образом, общий выигрыш ОСШ квантования для кодеков АДИКМ с ФП на основе МАХЯ при скоростях передачи ниже 24 кбит/с составит 3 дБ. В приложении Б на рисунке Б.5 показаны зависимости выигрыша КПР от скорости передачи в системах АДИКМ (с ПП - кривая 1, с ОП на приемной стороне - кривая 2 и с ФП -кривая 3). Как видно из зависимостей, применение модифицированного алгоритма позволяет получить выигрыш на скорости 16 кбит/с в системе АДИКМ с ПП на 0,4 балла (с 2,8 балла до 3,2 балла согласно ГОСТ Р 5084095), в системе АДИКМ с ФП 0,4 балла (с 2,4 балла до 3 баллов), в системе АДИКМ с ОП на приемной стороне 0,2 балла (с 3 баллов до 3,2 балла согласно ГОСТ Р 50840-95). Как следует из анализа приведенных зависимостей, применение МАХЯ при данных скоростях позволит существенно повысить КПР [86].
2.2.3 Разработка полосового вокодера на основе модификации алгоритма Хургина - Яковлева
Представляет интерес разработка вокодеров и полувокодеров на основе МАХЯ, работающих на более низких скоростях. Одними из главных требований для алгоритма кодирования РС служат простота его реализации и минимальные вычислительные затраты. Базовой моделью, подлежащей дальнейшему усовершенствованию на основе МАХЯ, предлагается использовать модель полосового вокодера, наиболее удобного с точки зрения реализации и вычислительных затрат. Кроме того, основные элементы полосового вокодера, так же, как и кодека АДИКМ, лежат в основе многих современных алгоритмов кодирования, таких как CELP, MELP, MPEG и других. В полосовых вокодерах, построенных на основе теоремы
В.А. Котельникова, обычно передаются спектральные отсчеты в пределах критических полос и полос равной разборчивости. Средние частоты для полос равной разборчивости были получены Э. Цвинкером [87] и М.А. Сапожковым [88]. С целью увеличения КПР предлагается реализация полосового вокодера на основе МАХЯ при частоте дискретизации 8 кГц. На рисунке 2.3 показана схема предложенного полосового вокодера на приемной и передающей стороне.
Sn(w) SnCw/a Snk(w/2) S'n(w/2) S'n(w)
Рисунок 2.3 - Структурная схема полосового вокодера на основе МАХЯ (приемная и передающая стороны)
В блоке БПФ осуществляется преобразование Фурье РС, а в блоке Пр -формирование спектра производной Sn(n) путем перемножения амплитудного спектра РС S(n) с линейно возрастающей функцией и сдвигом фазового спектра РС на -л/2:
S(n) = j2nnSc(n) / N = 2nnSc(n) • ejW2 / N. (2.5)
Затем, c учетом децимации в два раза отсчетов РС, осуществляется операция наложения одной половины комплексного спектра на другую (комплексные отсчеты спектра в пределах полосы частот 0.4000 Гц складываются с отсчетами спектра в области частот 4000.8000 Гц). Спектральные ДОС и ДОП можно записать как
Sc,p (n) = 1(SCH4 (n)e
rfc.m (n)
+ SCB4 (N - n)e
j^OBH (N-n)
)
Sn.np (n) = 1(S_ (n)e
.Ж.нч (n)
+ Sn44 (N - n)e
Ж.вч (N-nh
(2.6)
где 8снч (п), Scвч (п), Бпнч (п), ^ (п) - спектральные отсчеты растянутого прообраза спектра ДОС и ДОП в низкочастотной и высокочастотной областях. Подобная операция аналогична децимации РС во временной области. Для большего сокращения избыточности происходит выделение и передача частотных полос с взятыми во внимание полосами критической слышимости и полосами равной разборчивости. Для восстановления полного спектра по переданным спектральным отсчетам применяется интерполятор нулевого порядка. Применение интерполятора не обязательно из-за свойств слуха. После чего спектральные отсчеты прореженного сигнала и производной проходят через предложенные фильтры и далее суммируются. На выходе выполняется обратное преобразование Фурье от полученного спектра [89]. Исследуем расположение критических частот при построении полосового вокодера на основе МАХЯ. При расчете критических полосок спектральных ДОС и ДОП необходимо учитывать не только средние значения полосок равной разборчивости в низкочастотной части спектра Fн, но и соответствующие им зеркальные частоты в высокочастотной части спектра Кзвч, положение в спектре для которых можно вычислить по формуле:
В таблице 2.1 показаны значения десяти спектральных полосок в пределах полосы частот 300.2000 Гц, их ширина, а также значения соответствующей ей частоты в высокочастотной части спектра. Соответствующие значения средних частот для полос равной разборчивости в высокочастотной части спектра приведены рядом в скобках.
Общее количество спектральных отсчетов прореженного сигнала Nобщ
можно вычислить по формуле:
F = К - F .
звч о н
звч
н
(2.7)
(2.8)
где Ыпрс - количество спектральных ДОС, Ыпрп - количество спектральных
ДОП. Полагая, что в пределах 1, 2 и 3 полосок сосредоточены первая и вторая форманты, а также, учитывая перекрытия частот, что приводит к передаче в пределах одной полоски двух критических частот, возможно сократить избыточность передаваемой информации, путем передачи наиболее важных критических частот, из полученных в таблице 2.1. Таблица 2.1 — Значения частот
Номер Средняя частота Ширина Средняя частота Полученная
полоски критических полоски, перекрываемых средняя
полосок по Гц критических частота, Гц
Цвинкеру, Гц полосок, в высокочастотной части спектра, Гц
1 350 100 3650 350
2 450 110 3550 450
3 570 120 3430 (3400) 570
4 700 140 3300 700
5 840 150 3160 840
6 1000 160 3000 1000
7 1170 170 2830 (2900) 1170
8 1370 210 2630 1370
9 1600 240 2400 (2500) 1600
10 1850 280 2150 (2150) 1850
Рассмотрим восстановление РС в полосовых вокодерах с применением теоремы В.А. Котельникова и МАХЯ. Эксперимент проводился на реализации РС длительностью 16 мс с частотой дискретизации 8 кГц. Исследования алгоритма полосового вокодера производились для 10 и 6 критических полосок, значения средних частот для которых приведены в таблицах 2.2.2.3. 2.3
Таблица 2.2 — Минимальный набор критических частот для МАХЯ
Номер полоски Значения средних частот, /ср, Гц
1 375
2 438
3 563
4 1188
5 1625
6 1875
Таблица 2.3 — Максимальный набор критических частот для МАХЯ
Номер полоски Значения средних частот, /ср, Гц
1 375
2 438
3 563
4 688
5 813
6 1000
7 1188
8 1375
9 1625
10 1875
Доверительные интервалы зависимостей качества и разборчивости
восстановленного сигнала, рассчитанные для 1000 реализаций с вероятностью 99 % составляют 0,01.0,025 балла согласно ГОСТ Р 50840-95 при оценке КР и 0,05 дБ при оценке ОСШ для различных выборок РС на выходе исследуемых кодеков. Передача К спектральных отсчетов амплитудного и К отсчетов фазового спектра, взятых с одинаковой общей разрядностью Ва=Вф=В для речевого сегмента t=16 мс при частоте дискретизации ^= 8 кГц обеспечивает скорость передачи:
С = 2В ■ К ■ ^^ = 125ВК . Например, при К=12, В=4 скорость передачи С=6 кбит/с; при К=12, В=3 скорость передачи составит С=4,5 кбит/с; К=20, В=4 скорость передачи С=10 кбит/с; К=20, В=3 скорость передачи С=7,5 кбит/с. Как показано на основе экспериментальных исследований, при
использовании в полосовом вокодере для восстановления РС МАХЯ незначительно уменьшается узнаваемость РС за счет потери части важной для слуха информации при децимации. В то же время при использовании МАХЯ в полосовом вокодере существенно увеличивается разборчивость и уменьшается уровень различимых на слух шумов квантования. Как следует из анализа зависимостей, показанных в приложении Б на рисунке Б.6, применение МАХЯ в полосовом вокодере позволяет повысить КПР на 0,2.0,5 балла согласно ГОСТ Р 50840-95. В качестве объективного критерия оценки КПР рассмотрим показанные в приложении Б на рисунках Б. 7, Б. 8 зависимости ОСШ восстановленного сигнала от скорости передачи и разрядности кодирования для известного алгоритма полосового вокодера -кривая 1 и алгоритма полосового вокодера с применением МАХЯ - кривая 2. Зависимости, показанные в приложении Б на рисунке Б.7, получены при фиксированной разрядности амплитудного и фазового спектров, равной 4, и различном числе передаваемых спектральных отсчетов. В приложении Б на рисунке Б.8 приведены зависимости в случае передачи 20 и 12 отсчетов амплитудного и фазового спектра (а и б соответственно). Как следует из анализа зависимостей, ОСШ восстановленного РС в предложенном алгоритме больше на 3,5 дБ ОСШ известного алгоритма полосового вокодера. Данное увеличение можно объяснить более точным восстановлением РС в системах на основе МАХЯ, а также большим количеством априорной информации, содержащейся в спектральных отсчетах производной.
В приложении Б на рисунке Б.9 показаны зависимости КПР от разрядности представления фазового спектра в системах с классическим алгоритмом полосового вокодера - кривая 1 и с применением МАХЯ -кривая 2. Зависимости приведены для различной разрядности представления отсчетов амплитудного спектра РС (Ва=3 - а и в, Ва=4 - б и г) и для различного числа передаваемых спектральных отсчетов: при передаче всех
спектральных отсчетов в пределах полосы частот 300 -3400 Гц (а и б) и при передаче 12 спектральных отсчетов амплитудного и фазового спектров в пределах критических полосок (в и г). Как следует из анализа зависимостей, реализация полосового вокодера на основе МАХЯ позволяет снизить без существенного уменьшения КПР разрядность представления отсчетов фазового спектра РС до Вф=2 при разрядности представления амплитудного спектра, равной - 3 и 4. В то же время в алгоритме полосового вокодера на основе теоремы В.А. Котельникова при разрядности представления амплитудного спектра Ва=4 подобной разрядности представления отсчетов фазового спектра недостаточно. При разрядности представления амплитудного спектра Ва=3 сохраняется выигрыш КПР на 0,2.0,3 балла согласно ГОСТ Р 50840-95.
Таким образом, при передаче 12 критических частотных полосок и разрядности кодирования отсчетов амплитудного спектра 4, а отсчетов фазового -2 в полосовом вокодере на основе МАХЯ возможно получить КПР на уровне 3,8 балла согласно ГОСТ Р 50840-95 при скорости передачи 4,5 кбит/с. Другим возможным кодеком на основе МАХЯ является модификация подполосного кодека, сочетающего преимущества полосового вокодера и кодека с АДИКМ. Показано, что применение МАХЯ в данном кодеке позволяет сократить вычислительные затраты за счет распараллеливания вычислений, уменьшить порядок предсказателей, а также реализовать адаптации предсказателя для отсчетов сигнала и производной в одном блоке. Применение данного представления позволяет увеличить помехоустойчивость данного кодека на 1,2.1,5 дБ и упростить реализацию синтезирующих фильтров. Показано, что предложенный алгоритм кодирования обеспечивает повышение КПР на 7.10 % или 0,3 балла согласно ГОСТ Р 50840-95, по сравнению с аналогичным кодеком на основе теоремы В. А. Котельникова, и обеспечивает КПР 4,6 балла, согласно ГОСТ Р 50840-95, при скорости передачи 6,4 кбит/с и 4,2 балла при скорости
передачи 4,8 кбит/с, что даёт основание для его использования в современных телекоммуникационных системах.
2.2.4 Реализация низкоскоростных кодеков на основе алгоритмов СЕЬР и модификации алгоритма Хургина - Яковлева
С учетом анализа современных стандартов передачи РС наиболее перспективной платформой для разработки современных адаптивных низкоскоростных и среднескоростных алгоритмов первичного кодирования РС является кодек CELP. Данный алгоритм обладает возможностями снижения скорости передачи за счет изменения разрядности, частоты анализа и объема передаваемых параметров, использует линейный предсказатель и процедуру векторного квантования, обеспечивает устойчивость к искажениям в радиоканале, а также удовлетворительное КПР при низких скоростях передачи [90]. Предложена реализация алгоритма CELP на основе МАХЯ при N=2, когда ДОС и ДОП обрабатываются одинаковыми кодеками. Получены зависимости КПР на выходе от параметров кодека алгоритма CELP на основе теоремы В.А. Котельникова и МАХЯ. Исследована эффективность МАХЯ по критерию КПР при прохождении ДОС и ДОП через кодек CELP. Результат эксперимента в виде графиков разности КПР при использовании МАХЯ ( К ), по сравнению с аналогичными кодеками на основе теоремы В.А. Котельникова (К^.) ЛК = Кх - К^, в зависимости от скорости передачи показан на рисунке Б.10.
2.2.5 Реализация алгоритмов низкоскоростного кодирования со скоростью передачи ниже 1 кбит/с на основе модификации алгоритма Хургина - Яковлева
С целью увеличения пропускной способности линий специальной и служебной связи необходимо разработать и использовать алгоритмы кодирования РС со скоростью передачи ниже 1000 бит/с. За основу такого кодека целесообразно использовать Codec2 - низкоскоростной аудиокодек
для кодирования РС, обеспечивающий кодирование РС с частотой дискретизации 8000 Гц со скоростями передачи - 3200 бит/с, 2400 бит/с, 1600 бит/с, 1400 бит/с, 1300 бит/с, 1200 бит/с, 700 бит/с и 450 бит/с. Таким образом можно сделать вывод, что при снижении скорости кодирования с 700 бит/с до 450 бит/с наблюдается значительное ухудшение КПР в среднем с 3,2 балла до 2,8 балла согласно ГОСТ Р 50840-95, что допустимо КПР согласно ГОСТ Р 50840-95. Поэтому рекомендуется дополнительная модификация алгоритма Codec2 для увеличения разборчивости речи. Возможно повысить КПР при использовании в Соёее2 МАХЯ. На рисунке 2.4 изображена схема исполнения алгоритма низкоскоростного кодирования РС Codec2 на основе МАХЯ.
Рисунок 2.4 - Обобщенная структурная схема алгоритма Codec2 на
основе МАХЯ
Таким образом, применение данного представления создаст условия реализации алгоритма кодирования на основе алгоритма Сodec2 при скорости передачи 700 бит/с. По итогам проведённых экспериментов удалось достичь увеличения КПР на 0,3.0,5 балла согласно ГОСТ Р 50840-95, по сравнению с аналогичным кодеком на основе теоремы В.А. Котельникова. Одновременно с этим стоит обратить внимание на то, что при реализации Соёее2 допустимо кодирование ДОС со скоростью 700 бит/с, а ДОП со скоростью 450 бит/с - это позволяет получить КПР на уровне 3.3,2 балла согласно ГОСТ Р 50840-95 на выходе кодека при скорости передачи (450+700)/2 = 575 бит/с. Таким образом, применение МАХЯ совместно с
речевым кодеком Codec2 создает условия для реализации КПР при передаче со скоростью 575 бит/с на уровне 3.3,2 балла, согласно ГОСТ Р 50840-95, что является достаточным и для применения данного кодека в линиях специальной и служебной связи.
2.2.6 Эффективность реализации кодеков речевых сигналов на основе модификации алгоритма Хургина - Яковлева
Проведем сравнение кодеков на основе теоремы В.А. Котельникова и модифицированного алгоритма на основе известных алгоритмов кодирования. Анализ приведен без учета АП и искажений в радиоканале. В приложении Б в таблице Б1 приведены значения КПР на выходе первичных кодеков на основе теоремы В.А. Котельникова и МАХЯ, а также выигрыш КПР для систем на основе МАХЯ относительно аналогичных кодеков на основе теоремы В.А. Котельникова. Аналогичные значения приведены в приложении Б в таблице Б2 для известных кодеков при оценке КПР согласно шкале MOS с помощью программы PESQ. Как видно из приведенной таблицы, кодеки РС на основе МАХЯ обеспечивают лучшее КПР по сравнению с аналогичными кодеками на основе теоремы В.А. Котельникова за счет компенсации шумов квантования в кодеках ДОС и ДОП.
2.3 Реализация кодеков речевых сигналов на основе вейвлет-пакетного разложения и модификации алгоритма Хургина -Яковлева
Как показано в 1-й главе данной диссертационной работы, предложенный алгоритм обеспечивает схожие с ВПР алгоритмы обработки сигналов. Необходимо рассмотреть возможности совместного использования МАХЯ и ВПР для достижения наибольшей эффективности алгоритмов первичного кодирования. Обобщенная структурная схема разрабатываемого кодера представлена в приложении Б на рисунке Б.1 1.
Далее отсчеты поступают на блок модификации представления Хургина - Яковлева, в котором осуществляется предложенный алгоритм с
различной глубиной разложения для N=2. Полученные ДОС и ДОП поступают в ДЦ, где происходит отброс каждого второго отсчета сигнала и производной. Отсчеты сигнала и производных поступают на блок ВПР, состоящий из фильтров декомпозиции. Отсчеты, имеющие энергию ниже заданного порога, обнуляются. Результирующий набор коэффициентов подвергается 3-битному квантованию с целью уменьшения скорости передачи. Затем ДОС и ДОП поступают в радиоканал. Схема устройства декодирования РС представлена в приложении Б на рисунке Б. 12. Блок первичного декодирования производит декодирование коэффициентов ветвей разложения, которые подаются на блок обратного дискретного вейвлет-преобразования. При восстановлении сигнала по его вейвлет-коэффициентам процесс идет от крупных масштабов к мелким. Для проведения экспериментальных исследований выбраны следующие вейвлеты: вейвлет Хаара (Haar); вейвлет Добеши 3-го порядка (Db3); биортогональный сплайн вейвлет 3.5 (Bior3.5); вейвлет Мейера (Mey). Для каждого вейвлета последовательно изменялись уровни разложения от 2 до 5. Коэффициент сжатия и КПР представлены в таблице 2.4.
Графики зависимости КПР от уровня разложения вейвлет-пакета для различных видов вейвлет-пакетов представлены в приложении Б на рисунке Б. 13. На графиках обозначены следующие алгоритмы ВПР: под цифрой 1 -ВПР Хаара (Haar), под цифрой 2 -вейвлет-пакет Добеши 3 порядка (Db3), под цифрой 3 -биортогональный сплайн ВПР 3.5(Bior3.5), под цифрой 4 -ВПР Мейера (Mey).
Таблица 2.4 -Эффективность сжатия и КПР на выходе для различных видов материнского вейвлета и уровней ВПР
Вид ВПР 2-й уровень 3-й уровень 4-й уровень 5-й уровень
Вейвлет Оценка качества Kc (%) Оценка качества Kc (%) Оценка качества Кс (%) Оценка качества Kc (%)
Haar 3,313 42 2,899 28 2,713 25 2,642 23
Db3 4,196 63 3,620 58 2,992 54 2,989 48
Bior3.5 4,270 60 4,083 53 3,342 48 2,975 42
Mey 4,402 62 4,161 55 3,127 51 2,657 44
Как видно из приведенных зависимостей в приложении Б, на рисунок Б. 18, начиная с 3-го уровня разложения наилучшее значение КПР имеет биортогональный сплайн вейвлет-пакет 3.5 (Bior3.5). График зависимости коэффициента сжатия от уровня ВПР для различных видов вейвлет-пакетов представлен в приложении Б на рисунке Б.14. На графике показаны зависимости для различных видов ВПР: 1 - вейвлет Хаара (Haar), 2 - вейвлет Добеши третьего порядка (Db3), 3 - биортогональный сплайн вейвлет 3.5(Bior3.5), 4 - вейвлет Мейера (Mey). Как видно из рисунка Б.14, наилучшее значение коэффициента сжатия РС при всех уровнях разложения имеет вейвлет-пакет Хаара (Haar), однако согласно анализу зависимостей в приложении Б на рисунке Б.13 вейвлет-пакет Хаара имеет самые низкие оценки КПР. Для выбора оптимального вида и уровня ВПР зафиксируем значение коэффициента сжатия на уровне 55 %. С учетом данного требования наилучшей оценкой обладает биортогональный сплайн вейвлет-пакет 3,5 (Bior3,5) с уровнем разложения 4. Значение «3,5» в обозначении названия вейвлета означает 3-й порядок декомпозирующего вейвлета и 5-й порядок реконструирующего вейвлета. Для определения эффективного уровня ВПР проведено моделирование схем с однократным, двукратным, трехкратным и четырехкратным ВПР. Выбор уровня ВПР осуществлён по КПР после прохождения блока модифицированного представления Хургина - Яковлева. Оценка КПР осуществляется на выходе предложенной системы
передачи РС с частотой дискретизации 8 и 16 кГц при использовании биортогонального сплайн вейвлета. При этом для значений коэффициентов сжатия, равных 25 %;50 %; 75 %, оценка КПР осуществлялась по стандарту ITU-T P.862.2 с помощью программы PESQ. В результате получены зависимости КПР от уровня МАХЯ для различных коэффициентов сжатия. Результаты экспериментальных исследований приведены в таблице 2. 5.
Таблица 2.5 - Зависимость качества речевого сигнала от уровня МАХЯ
Уровень Оценка КР при Оценка КР при Оценка КР при
разложения T to=const=25 % to=const=50 % to=const=75 %
1 3,983 3,415 2,175
2 3,994 3,435 2,189
3 4,015 3,524 2,215
4 3,879 3,076 2,176
Графики зависимости КПР от коэффициентов сжатия для разных уровней разложения представлены в приложении Б на рисунке Б. 15: кривая 1- первый уровень разложения, кривая 2 - второй уровень разложения, кривая 3 - третий уровень разложения, кривая 4 - четвертый уровень разложения. Как видно из приведенных зависимостей, наилучшие значения КПР обеспечивает третий уровень разложения МАХЯ. Для обоснования предложенной структурной схемы проведем анализ различных вариантов построения системы передач на основе ВПР и МАХЯ. Полученные оценки КПР для различных вариантов системы передачи на основе ВПР приведены в таблице 2.6. В приложении Б на рисунке Б. 16 изображены графики зависимостей КПР для различных коэффициентов сжатия. На рисунке введены обозначения^ - схема кодирования на основе ВПР, 2-схема кодирования на основе ВПР и МАХЯ, 3-схема кодирования с заменой на первой ступени ВПР на предложенный алгоритм.
Таблица 2.6 - Оценки КПР для различных вариантов системы передачи
на основе ВПР и МАХЯ
Модель кодирования Оценка КПР при Кс=const=25 % Оценка КПР при Кс=const=50 % Оценка КПР при Кс=const=75 %
Схема кодирования на основе ВПР 3,865 3,342 2,442
Схема кодирования на основе ВПР и МАХЯ 4,036 3,615 2,189
Схема кодирования заменой на первой ступени ВПР МАХЯ 3,715 3,255 2,215
Анализируя результаты экспериментальных исследований, видим, что наилучшие показатели качества обеспечивает схема кодирования на основе ВПР и МАХЯ. Показательно, что применение обработки на основе МАХЯ после ВПР позволяет улучшить КПР в среднем на 0,3 балла согласно ГОСТ Р 50840-95. В диссертационной работе применялось ВПР не выше пятого порядка d=5, так как дальнейшее увеличение глубины разложения приводит к увеличению времени задержки и вычислительных затрат. В приложении Б на рисунке Б. 17 приведены зависимости КПР, оцененные в соответствии с ГОСТ Р 50840-95, от требуемой скорости передачи с использованием ВПР и МАХЯ для ВПР Мейера - кривая 1, биортогональных ВПР - кривая 2, ВПР Добеши 2 - кривая 3. Анализ зависимостей показал, что при скорости передачи 9 кбит/с алгоритм на основе ВПР и МАХЯ обеспечивает КПР К=4,4 балла, согласно ГОСТ Р 50840-95 (ВФ Мейера), К=4,3 балла (биортогональные ВФ), К=4,2 балла (ВФ Добеши 2). Таким образом, алгоритм на основе ВПР и предложенный алгоритм обеспечивают КПР на 0,3 балла выше, по сравнению с алгоритмом на основе ВПР. На рисунке 2.5 приведены графики оценки КПР в зависимости от скорости передачи без шумов в радиоканале - рисунок 2.5, а, при действии помех и вероятности ошибок в радиоканале 5 % -рисунок 2.5, б.
ОЦЕНКА КАЧЕСТВА РЕЧИ ПРИ 5 %
/ 2
6 С, кбит/с
а б
Рисунок 2.5 - Зависимости КПР при действии помех в радиоканале
Под цифрой 1 обозначены оценки КПР на выходе стандартных низкоскоростных кодеков на основе теоремы В.А. Котельникова, под цифрой 2 - оценки КПР на выходе комбинации ВПР и стандартных низкоскоростных кодеков, под цифрой 3 - оценки КПР на выходе комбинации ВПР, МАХЯ и стандартных низкоскоростных кодеков. Как видно из анализа приведенных зависимостей, применение ВПР обеспечивает снижение скорости передачи речевого трафика, а применение МАХЯ обеспечивает дополнительную помехоустойчивость и повышение КПР до 0,7 балла согласно ГОСТ Р 5084095 относительно классических низкоскоростных кодеков на основе теоремы В.А. Котельникова.
2.4 Алгоритм передачи речевых сигналов в комплексном виде
2.4.1. Алгоритм представления речевых сигналов в комплексном виде
Наряду с представлением исходного сигнала в виде ДОС и соответствующих им ДОП, возможно использование комплексного представления этих отсчетов при их совместной передаче. Во временной области комплексный сигнал имеет вид:
(2п) = / (2п) +'(2п). (2.9)
Тогда, в соответствии со свойствами преобразования Фурье, спектр комплексного сигнала имеет вид:
^ (п) = 8спр (п) + ]Ъппр (п). (2.10)
Используя свойства комплексного сигнала, спектральные отсчеты ДОС и ДОП можно записать, используя отсчеты спектра комплексного сигнала:
^(п) = (п) -5Е*(К-п)/2] , 5с(п) = (5,(п) + £*(К -п))/2 , (2.11)
где *(п) - отсчеты его комплексно-сопряженной матрицы. Представим спектральные отсчеты производной в виде следующего выражения: ^ (п) = ]Кпр (п)8СПр (п), (2.12)
где Кпр (п) - коэффициент пропорциональности для ДОП относительно ДОС, который можно найти из выражения (2.11):
= я • п • С) • ехрр Х 2У К + я • (2К - п) 8си (п) ехр(-/ я/ 2)/ К пр()"Апр(п)" .[(п)+5еи.(и)] . (. )
С учетом, что в низкочастотной части спектра в выражении (2.12) имеет больший энергетический вес левая часть выражения, а в высокочастотной части - правая часть, выражение для коэффициента пропорциональности при длительности исходного сигнала 2-К - отсчетов принимает вид:
• ехр(/я/2) при К /2 > п, К (2.14)
КПр (п У
я •(Ж - п\ - ехр(-.^2) при К /2 < п < К.
К
Используя (2.11 ), получаем выражение, отражающее удельный вес спектра действительной и мнимой части, согласно которому возможно восстановить спектры исходного сигнала и его производной: ^(п) - (п)/[1 - Кпр(п)], ^(п)«.КПр(п)5с(п) = .КПр(п)^(п)/[1 -Кпр(п)]. (2.15)
При передаче спектральных отсчетов комплексного сигнала его вторую часть можно восстановить по формулам:
*( К - п) * (И).
1 + Кпр (п)
1 - К„р (и)
, 5, (К - п) * 5, *(п)
1 + КПр (п)
1 - К„р (п)
(2.16)
2.4.2. Полосовой вокодер на основе комплексного представления речевого сигнала
Реализация полосового вокодера на основе комплексного представления подразумевает передачу отсчетов в пределах критических полос амплитудного и фазового спектра комплексного сигнала с последующим восстановлением действительной и мнимой части, являющихся ДОС и производной. Затем в соответствии с предложенным алгоритмом происходит восстановление исходного РС. При таком представлении, при передаче отсчетов сигнала и производной в комплексном виде, происходит учет корреляции отсчетов сигнала и производной. На рисунке 2.6 изображена структурная схема полосового вокодера, исполненная на основе рассмотренного ранее комплексного представления спектральных отсчетов в предложенном алгоритме.
Ап(п) -Апк(п) Щ2п)
ВЫБ ад ДЕЦ
та
ад
Комп
№
ДЦ ДЕЦ
Щп)
БПФ
КвАС
СхКП
Фп(2п)
КвФС
(2п) Йи(п) ♦
Ф1
Х1(п)
Фпк(2п)
Щ2п) Аи'(п)
Рисунок 2.6 - Структурная схема кодера и декодера с использованием комплексного представления РС на основе МАХЯ
Как следует из данной структурной схемы, ДОС и ДОП поступают в схему, реализующую комплексное представление, согласно формуле (2.16). Затем производится вычисление спектра комплексного сигнала в блоке БПФ и отброс критических частот в схеме выделения критических полосок -СхКП. После этого осуществляется раздельное квантование амплитудного и
+
фазового спектров в квантователях амплитудного и фазового спектров -КвАС и КвФС. На приемной стороне производится восстановление исходного комплексного сигнала в блоке ОБПФ по отсчетам амплитудного и фазового спектра. Затем по действительной и мнимой части комплексного спектра в схемах СхВДЧ и СхВМЧ происходит восстановление ДОС и его ДОП, а после интерполяторов в фильтрах МАХЯ Ф1 и Ф2 происходит восстановление исходного РС. Как следует из анализа зависимостей, приведенных на рисунках Б.18 и Б.19 в приложении Б, при использовании передачи спектральных отсчетов в пределах 20 и 12 критических полосок (кривые 1 и 2 соответсвенно) вокодеры, использующие комплексное представление РС (кривая 3), обеспечивают сходное или худшее КПР по сравнению с вокодерами, использующими предложенный алгоритм (кривая 2), но лучшее, чем классический полосовой вокодер (кривая 1), при аналогичных скоростях передачи. Рассмотрим применение кода различной разрядности для кодирования отсчетов амплитудного и фазового спектра в вокодере комплексного представления РС на основе МАХЯ. В приложении Б на рисунках Б.20...Б.25 показаны зависимости КПР от разрядности представления отсчетов фазового спектра для разрядности представления амплитудного спектра 3 и 4 - Б.20, Б.22, Б.24 и Б.21, Б.22 и Б.25 соответственно, и числе передаваемых спектральных отсчетов амплитудного и фазового спектра (54 - Б.20 и Б.21; 20 - Б.22 и Б.23; 12 -Б.24 и Б.25). Зависимости приведены для полосовых вокодеров с применением представления РС в соответствии с теоремой В.А. Котельникова (кривая 1), с предложенным алгоритмом (кривая 2) и комплексным представлением (кривая 3). Как следует из анализа данных зависимостей, при разрядности представления фазового спектра, равного 2, использование комплексного представления позволяет добиться выигрыша в КПР при разрядности амплитудного спектра 3 - 0,2.0,3 балла согласно ГОСТ Р 50840-95 и при
разрядности 4 - 0,1.0,2 балла согласно ГОСТ Р 50840-95, по сравнению с представлением РС на основе МАХЯ. При передаче всех отсчетов амплитудного и фазового спектра применение комплексного представления при разрядности представления амплитудного спектра 3 и при разрядности представления фазового - 2 бита позволяет добиться выигрыша КПР 0,5.0,6 балла согласно ГОСТ Р 50840-95, по сравнению с полосовым вокодером на основе МАХЯ, а при разрядности представления амплитудного спектра 4-разрядным кодом и фазового - 2 бита выигрыш составит 0,2.0,1 балла. При передаче 20 спектральных отсчетов в вокодерах при передаче сигнала в комплексном виде на основе МАХЯ с разрядностью представления амплитудного спектра 4 и фазового спектра 2 возможно получить КПР на уровне 4,1 балла согласно ГОСТ Р 50840-95 при скорости передачи 3,75 кбит/с. Как следует из анализа приведенных зависимостей, применение алгоритма комплексного представления РС на основе модифицированного алгоритма целесообразно в полосовом вокодере при низких скоростях передачи при разрядности амплитудного спектра не выше 3 и разрядности фазового спектра не выше 2. При полной передаче спектральных отсчетов применение комплексного представления возможно при небольшой разрядности представления амплитудного и фазового спектра.
2.5 Выводы
Во второй главе осуществлена реализация кодеков речевых сигналов в радиотехнических устройствах на основе МАХЯ. Анализ результатов исследований позволяет сделать следующие выводы:
1. Показана эффективность применения МАХЯ в кодеках АДИКМ, позволяющего увеличить ОСШ квантования на 1.3,5 дБ, а также повысить ОСШ при действии АП на 0,5.3 дБ при скоростях передачи 8.48 кбит/с.
2. Разработан алгоритм оценки коэффициентов предсказания ДОП по коэффициентам предсказания ДОС. Показано, что применение данного
алгоритма обеспечивает выигрыш в вычислительных затратах порядка двух раз по сравнению с аналогичными алгоритмами на основе теоремы В.А. Котельникова.
3. Разработан полосовой вокодер на основе МАХЯ и получены значения критических полос для ДОС и ДОП. Показано, что применение МАХЯ в полосовом вокодере позволит получить КПР на уровне 3,8 балла согласно ГОСТ Р 50840-95 при скорости передачи 4,8 кбит/с.
4. Разработаны низкоскоростные кодеки на основе МАХЯ и кодека CELP. Получены оптимальные значения для параметров кодеров ДОС и ДОП, позволяющие получить выигрыш в КПР до 0,5 согласно ГОСТ Р 50840-95 в рамках диапазона рабочих скоростей кодека СБЬР.
5. На основе МАХЯ создана модификация кодека Сodec-2, что позволило обеспечить КПР при передаче со скоростью 575 бит/с на уровне 3.3,2 балла согласно ГОСТ Р 50840-95, что удовлетворяет применению данного кодека в линиях специальной и служебной связи.
6. Исследовано совместное использование ВПР и МАХЯ для сокращения избыточности передаваемого РС. Показано, что применение ВПР обеспечивает снижение скорости передачи речевого трафика, а применение МАХЯ обеспечивает дополнительную помехоустойчивость и повышение КПР до 0,7 балла согласно ГОСТ Р 50840- 95, относительно классических низкоскоростных кодеков на основе теоремы В.А. Котельникова.
7. Представлен алгоритм на основе комплексного представления МАХЯ, что позволило увеличить КПР в полосовом вокодере на основе МАХЯ на 0,3.0,5 балла согласно ГОСТ Р 50840-95 при скорости передачи 5,6.1,2 кбит/с.
3 АЛГОРИТМЫ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ В РАДИОКАНАЛЕ ПРИ ДЕЙСТВИИ АКУСТИЧЕСКИХ ПОМЕХ И ШУМОВ В РАДИОКАНАЛЕ 3.1 Вводные замечания
На РС при его хранении, обработке и передаче по радиоканалам влияет ряд искажающих факторов, что снижает общее КПР на приеме. На РС в реальной акустической обстановке всегда влияют АП. В некоторых случаях, когда спектр помехи близок к спектру сигнала или при большом ОСШ, АП может заметно исказить КПР на приеме. В настоящий момент разработано очень большое количество разнообразных методов цифровой обработки зашумленных РС, но полное подавление АП невозможно, поэтому необходимо минимизировать их влияние на кодируемый сигнал в первичном кодере. Степень искажения при этом зависит от алгоритма первичного кодирования, а также вида АП и ОСШ. С точки зрения адаптации первичного кодека возможно выбрать алгоритмы и параметры первичного кодирования, которые обеспечивают оптимальное КПР на приемной стороне при действии определенных видов помех при заданном диапазоне скорости передачи.
Искажения также возникают, когда на закодированный РС воздействуют шумы и в битовом потоке в приемнике возможно возникновение ошибок. Они вносят случайные искажения и значительно снижают КПР. Все эти искажения в значительной степени влияют на КПР на выходе системы передачи [110.112]:
Применение МАХЯ на основе модификации представления Хургина -Яковлева в системах передачи и обработки РС позволяет снизить данные искажения за счет раздельной обработки отсчетов сигнала и производной. С целью разработки алгоритмов обработки РС на основе теоремы В.А. Котельникова и МАХЯ при действии акустических помех и шумов в третьей главе необходимо решить следующие задачи:
1. Провести исследования воздействия АП на основные известные кодеки РС на основе теоремы В.А. Котельникова и МАХЯ.
2. Провести исследования воздействий шумов и искажений в радиоканале на КПР на выходе кодеков на основе теоремы В.А. Котельникова и МАХЯ.
3. Разработать и исследовать алгоритмы уменьшения влияния помех и искажений в радиоканале на КПР на выходе первичного кодека.
4. Разработать и исследовать алгоритмы восстановления блоков отсчетов прореженного сигнала по отсчетам производной и отсчетов прореженной производной по прореженным отсчетам сигнала для систем на основе МАХЯ.
5. Разработать алгоритмы восстановления РС в низкоскоростных кодеках на основе итерационных методов.
6. Рассмотреть использование методов регуляризации итерационных алгоритмов на основе МАХЯ для улучшения КПР при восстановлении РС на приемной стороне.
3.2 Исследование воздействия акустических помех на кодеки речевых сигналов
3.2.1 Условия проведения эксперимента по исследованию воздействия акустических помех
Объектом исследования настоящей работы являются кодеки речи при влиянии различных АП. Для оценки КПР и узнаваемости голоса диктора использовались тестовые фразы, приведенные в ГОСТ Р 50840-95 [113]. Речевой материал был начитан десятью дикторами. Запись РС осуществлялась в специальном помещении кабинетного типа (с размерами 5,7*2,9*3 м и временем реверберации порядка 350 мс) при наличии естественной фоновой АП слабого уровня. Для записи использовался профессиональный диктофон Olimpus LS -10 (Linear PCM recorder), обеспечивающий возможность записи РС в формате WAV со следующими
параметрами: частота дискретизации 44,1 кГц; разрядность квантования 16 бит; тип кодирования ИКМ. Диктофон был установлен на расстоянии 0,5 м перед диктором на уровне лица. Для исследования кодеков речи использовалась программа "VOCdemo". Для исследований выбраны наиболее часто используемые в настоящее время кодеки: Spirit LBRAMR (1 кбит/с), Spirit LBRAMR (1,2 кбит/с), Spirit MMBE (1,2 кбит/с), Spirit LBRAMR (2 кбит/с), Spirit LBRAMR (2,4 кбит/с), Spirit MMBE (2,4 кбит/с), Spirit RMMBE (2,4 кбит/с), ICELP (4,8 кбит/с), G.723.1 (5,3 кбит/с), ICELP (6 кбит/с), G.723.1 (6,3 кбит/с), G.726 (32 кбит/с), G.726 (40 кбит/с), G.722 (48 кбит/с), G.722 (56 кбит/с), G.722 (64 кбит/с). На РС накладывались следующие естественные АП: звуки стиральной машины, двигателя, самолета, музыки, фена, чайника, поезда. Также накладывались искусственные АП, являющиеся нормальным процессом ИП, ШП, УП 1 (500.1000 Гц), УП 2 (1000.1500 Гц) и УП 3 (2000.2500 Гц). С учетом частотных и временных характеристик представленные АП можно разделить на импульсные, узкополосные и широкополосные [114]. Схема проведения исследований показана на рисунке 3.1.
Шум
Рисунок 3.1 - Структурная схема получения субъективной оценки
качества речи
На рисунке 3.1: М - микрофон (или другое устройство записи РС), ПФ - полосовой фильтр, К - кодек РС, Д -динамик. Записанная на диктофон фраза поступает на ПФ с полосой 0,1.3,4 кГц, затем конвертируется программным конвертором ПК с частотами дискретизации 8 кГц или 16 кГц
и разрядностями квантования 8 или 16 бит. Далее на РС накладывается АП и полученная смесь поступает на вход блока К. В блоке К происходит кодирование и декодирование РС в соответствии с принятыми по международным стандартам кодеками. Декодированный РС поступает на акустические колонки и в соответствии с ГОСТ Р 50840-95 производится оценка КПР в баллах исходя из соответствия между КПР и оценкой в баллах. На каждый РС по отдельности накладывались АП с различным ОСШ: - 10; 0; 10; 20 и 30 дБ. Описанные выше действия были повторены для десяти фраз десяти различных дикторов. После чего была подсчитана усредненная оценка для всех дикторов и аудиторов [115]. Для исследования КПР на выходе кодеков на основе МАХЯ с использованием приведенной на рисунке 3.2 структурной схемы, записанная с помощью микрофона (М) фраза преобразовывается программным конвертором с частотами дискретизации равными 8 кГц или 16 кГц и разрядностями квантования 8 или 16 бит. Далее на РС накладывалась АП с определенным уровнем для обеспечения необходимого ОСШ для смеси сигнала и АП (-10, 0, 10, 20, 30 дБ). Полученная смесь поступала на полосовой фильтр (ПФ) с полосой 0,3.3,4 кГц и затем на блок первичного кодирования РС на основе МАХЯ [116].
Рисунок 3.2 - Структурная схема первичного кодирования РС на основе
МАХЯ
Затем дискретизированный сигнал поступает на дифференциатор, где происходит получение отсчетов производной [117]. Далее полученные дискретные отсчеты сигнала и производной поступают в дециматор, где
происходит отброс каждого второго отсчета. ДОС и ДОП поступают на кодер, где РС кодируется исследуемым первичным кодером в соответствии с алгоритмом кодирования, и далее передаются в радиоканал. При этом ДОС и ДОП возможно передавать не только по одному каналу, но и по раздельным. Из радиоканала кодированные отсчеты сигнала и производной поступают в приемник. По окончании декодирования в декодере в соответствии с исследуемым алгоритмом, ДОС и ДОП поступают на интерполятор, в котором происходит вставка между соседними отсчетами входного сигнала нулевых отсчетов. После этого отсчеты сигнала и производной подаются на восстанавливающие фильтры Ф1 и Ф2 и далее на сумматор, где восстанавливаются отсчеты. Полученный РС поступает на акустические колонки, где в соответствии с ГОСТ Р 50840-95 производится оценка КПР в баллах десятью аудиторами.
3.2.2 Исследование воздействия акустических помех на кодеки речевых сигналов на основе теоремы В.А. Котельникова
Рассмотрим воздействие АП на кодеки РС на основе теоремы В.А. Котельникова. Для каждого вида АП были построены зависимости КПР по шкале MOS от ОСШ для низкоскоростных кодеков (приложение В, рисунки В.1...В.2) таблица 3.1. Произвели сравнительный анализ среднескоростных кодеков при ОСШ и определили кодеки, наиболее устойчивые к АП (таблица 3.2). На рисунках В.3...В.6 приведены зависимости усредненных оценок от ОСШ при воздействии АП. Произвели сравнительный анализ высокоскоростных кодеков при ОСШ и определили кодеки, наиболее устойчивые к АП (таблица 3.3) [118].
Таблица 3.1 -Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии различных видов АП для низкоскоростных кодеков
Вид АП Кодек, наиболее устойчивый к АП
Узкополосный 1.LBRAMR 2.4 кбит/с, 2. ММВЕ 2.4 кбит/с
Широкополосный 1. LBRAMR 2.4 кбит/с
Импульсный 1.LBRAMR 1.2 кбит/с, 2. LBRAMR 1 кбит/с
Таблица 3.2 -Алгоритмы первичного кодирования РС, обеспечивающие
наибольшее качество речи при действии различных видов АП
для среднескоростных кодеков
Вид АП Кодек, наиболее устойчивый к АП
Узкополосный 1. 0 729а 8 кбит/с, 2. ICELP 6 кбит/с
Широкополосный 1. 0 729а 8 кбит/с, 2. ICELP 6 кбит/с
Импульсный 1. 0 729а 8 кбит/с
Таблица 3.3 -Алгоритмы первичного кодирования РС, обеспечивающие
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.