Методика анализа и синтеза элементов тракта речепреобразования для низкоскоростных систем связи тема диссертации и автореферата по ВАК РФ 05.13.05, кандидат технических наук Лихачев, Александр Сергеевич

  • Лихачев, Александр Сергеевич
  • кандидат технических науккандидат технических наук
  • 2007, Москва
  • Специальность ВАК РФ05.13.05
  • Количество страниц 152
Лихачев, Александр Сергеевич. Методика анализа и синтеза элементов тракта речепреобразования для низкоскоростных систем связи: дис. кандидат технических наук: 05.13.05 - Элементы и устройства вычислительной техники и систем управления. Москва. 2007. 152 с.

Оглавление диссертации кандидат технических наук Лихачев, Александр Сергеевич

Обозначения и сокращения

Введение

Глава 1. Анализ моделей современных низкоскоростных вокодеров с параметрическим кодированием

1.1. Система кодирования речевого сигнала и вокодер, обзор литературы

1.1.1. Акустические особенности речевого сигнала

1.1.2. Модель системы обработки речевых сигналов

1.1.3. Критерии оценки характеристик кодирования речи

1.1.4. Основные пути для повышения качества кодирования речи

1.1.5. Выводы

1.2. Методы линейного предсказания

1.2.1. Обзор

1.2.2. Линейное предсказание с возбуждением от основного тона

1.2.3. Метод простого возбуждения

1.2.4. 1УСЕ модель возбуждения

1.2.5. Выводы

Глава 2. Аспекты построения, требования и методы оценки качества обработки речевой информации

2.1. Акустические характеристики речи

2.1.1. Двойственность природы речевого сигнала и его субъективное восприятие

2.1.2. Анализ уровнеграмм речевых сигналов

2.1.3. Спектральный анализ речевых сигналов

2.2. Субъективные и объективные методы оценки разборчивости речи 50 2.2.1. Субъективные методы оценки разборчивости

2.2.1.1. Общие положения методики ГОСТ

2.2.1.2. Общие требования и подготовка к измерениям, методы измерений и испытаний

2.2.1.3. Измерение разборчивости речи артикуляционным методом

2.2.2. Объективные методы оценки разборчивости

2.2.2.1. Аддитивная группа объективных оценок (А1, 577, %АЬсот)

2.2.2.2. Группа методов объективной оценки разборчивости на основе анализа модуляционной передаточной функции (577, ЯА8Т1, С50) 86 2.3. Выводы

Глава 3. Модели оценки качества речепреобразования на основе сравнительного анализа динамических спектрограмм.

3.1. Аналитическое исследование искажений речевых сигналов

3.1.1. Анализ фазового спектра сигнала

3.1.2. Анализ амплитудного и энергетического спектров сигнала

3.2. Графический метод качественного анализа на основе сравнительной оценки сонограмм речевых сигналов

3.3. Объективные методы оценки искажений и качества речепреобразования и методика их получения на основе сравнительного анализа динамических спектрограмм

3.4. Формальный метод оценки разборчивости на основе спектрального индекса артикуляции Ш

3.5. Экономическая эффективность

3.6. Выводы

Глава 4. Практическая реализация методики объективной оценки качества речепреобразования на основе сравнительного анализа

4.1. Функциональные возможности разработанного программного модуля

4.2. Проведение экспериментального исследования для различных типов искажений речевого сигнала

4.3. Проведение экспериментального исследования сравнительного анализа субъективной оценки и предлагаемой методики

4.4. Прикладное использование методики в процессе разработки программно-аппаратного комплекса связи «Уступ-С»

4.5. Выводы

Рекомендованный список диссертаций по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методика анализа и синтеза элементов тракта речепреобразования для низкоскоростных систем связи»

Актуальность проблемы.

Несмотря на значительный прогресс в области систем передачи данных, связанный с постоянным расширением частотных характеристик каналов связи, не ослабевает и практический интерес к низкоскоростным каналам. Для передачи речи в них используются вокодеры, которые стали популярными, поскольку они гарантируют представление акустического сигнала речи при низкой скорости передачи данных (9.6, 4.8, 2.4, 1.2 и даже 0.6 - 0.8 кбит/с). Поэтому, когда ограничены ширина канала связи или объем памяти для хранения информации, вокодерная техника гарантирует наилучшее использование доступных ресурсов.

Кроме технических этапов процесс проектирования вокодеров включает обязательные финальные аттестационные испытания устройства, требующие проведения время- и трудозатратных процедур. При этом остается открытым вопрос об оценке качества во время разработки (которая включает в себя непосредственно проектирование, реализацию, отладку, проведение предварительных испытаний и внесение коррекций в процессе эксплуатации), когда в программу или устройство вносятся новые элементы или производится корректировка уже имеющихся.

Важнейшим показателем качества систем связи является параметр, называемый разборчивостью передаваемой речи. Для поддержания качества обслуживания абонентов в системах связи необходимо, чтобы этот параметр сохранял свое значение как в обстановке зашумленности, так и при ухудшении параметров канала связи. Повышение качества речи путем оптимизации процесса речепреобразования остается нетривиальной задачей. Основной проблемой в процессе проектирования является нахождение оптимального компромиссного решения между требуемым качеством с одной стороны и сложностью, дороговизной алгоритмов и аппаратуры с другой.

В то же время оценка качества обработки речи остается сложным и трудоемким процессом. В нашей стране были разработаны и стандартизированы методики оценки параметров качества речи, разборчивости и узнаваемости при передаче по трактам радиотелефонной связи, а также низкоскоростной передачи речи по цифровым каналам такие как: ГОСТ 1660072, ГОСТ Р 50840-95 и ГОСТ Р 51061-97 [1-3]. Для оценки качества стандарты предлагают методики артикуляционных испытаний, целью которых является определение класса по разборчивости, в который попадает испытуемый образец кодера. К сожалению, такие испытания связаны с большими время-материальными затратами, требуют специальной подготовки квалифицированной группы операторов (аудиторов и слушателей), на организацию и подготовку которой накладываются жесткие требования. Также нельзя не учитывать необходимость в специальных приборах, оборудовании и квалифицированном персонале, способном на нем работать. В случае коммерческого и мелкосерийного производства, на стадии разработки или при наладке подобные затраты нецелесообразны.

Описанные в ГОСТ методики используют ЭВМ только для хранения данных, внесения и автоматизации подсчета результатов [1-3]. Можно констатировать, что они абсолютно не используют возможности современной вычислительной техники в области цифровой обработки и анализа как звуковой, в общем, так и речевой в частности, информации.

В работе предлагается метод сравнительной оценки систем речепреобразования, позволяющий значительно упростить процедуру и сократить время проектирования.

Цель работы и задачи исследования.

Цели работы: оптимизация параметров систем низкоскоростного речепреобразования для улучшения их технико-экономических и эксплуатационных характеристик и разработка нового методики оценки качества речепреобразования, снижающей затраты на проектирование низкоскоростных вокодерных систем.

Для достижения поставленной цели в работе решаются следующие основные задачи:

1. Рассмотрение особенностей реализации низкоскоростных вокодеров и анализ моделей их представления.

2. Нахождение эффективных наборов параметров ]¥СЕ модели возбуждения при решении задачи линейного предсказания с возбуждением от основного тона.

3. Анализ существующих методик и стандартов определения качества речевого преобразования ГОСТ и методик объективных оценок.

4. Разработка новой методики и программного модуля оценки качества цифровой обработки речи низкоскоростными вокодерами.

5. Внедрение разработанной методики оценки качества в процесс разработки и производства реальной системы низкоскоростного речепреобразования.

Методы исследования.

При решении поставленных задач были использованы положения теории цифровой обработки сигналов и передачи данных по цифровым каналам связи, теории линейных систем, информационных систем, акустики, языки программирования.

Научная новизна.

- Обоснована эффективность ¡¥СЕ модели возбуждения при решении задачи линейного предсказания с возбуждением от основного тона.

- Создана методика и программный модуль оценки качества преобразования речевой информации в низкоскоростных вокодерных системах, базирующиеся на сравнительном анализе искажений характеристики спектральной мощности речевого сигнала.

Практическая значимость.

Предлагаемые модели позволяют повысить качество обработки речевой информации в низкоскоростных вокодерах (разборчивость) и автоматизировать процесс проведения оценки качества речепреобразования.

Положения выносимые на защиту.

1. Обоснование структуры ЬРС вокодеров с И^СЕ возбуждением.

2. Анализ существующих методов оценок качества обработки речевой информации.

3. Новый метод оценки качества речепреобразования на основе сравнительного анализа динамических спектрограмм.

Внедрение результатов.

Теоретические и практические результаты диссертационной работы внедрены в производственный процесс ОК-4 ГУП ПНЦ «СПУРТ» при решении задачи оценки качества работы низкоскоростных вокодеров в процессе разработки и наладки опытной партии комплекса связи «Уступ-С». Была предложена модель и получены оценки качества речепреобразования образцов низкоскоростных вокодерных подсистем. Такой подход подтвердил свою эффективность в процессе внутреннего контроля качества работы низкоскоростных систем обработки речевой информации на этапах их разработки, коррекции и дальнейшего сопровождения. Актами о внедрении подтверждается, что разработанная модель и программный комплекс позволяют организовать процесс сравнительной оценки образцов низкоскоростных вокодеров, не прибегая к затратным процедурам комплекса артикуляционных испытаний.

В результате подтверждены следующие выводы работы:

- общее снижение затрат на разработку путем оптимизации по времени этапов разработки и коррекции (замена артикуляционных испытаний автоматизированной объективной сравнительной оценкой);

- сокращение времени проведения сравнительного анализа более чем в пять раз по сравнению с артикуляционным;

- снижение рисков проектных ошибок (принятия неправильного решения «лучше»/«хуже» при определении влияния незначительных изменений).

Апробация работы.

Основные положения диссертационной работы докладывались и обсуждались на Всероссийских межвузовских научно-технических конференциях студентов и аспирантов: "Микроэлектроника и информатика -2004", "Микроэлектроника и информатика - 2005", "Микроэлектроника и информатика - 2006", "Микроэлектроника и информатика - 2007", Международной научно-технической конференции "Электроника и информатика - 2005".

Публикации.

По материалам диссертации опубликовано пять тезисов докладов и три статьи.

Структура и объём диссертационной работы.

Рукопись диссертационной работы состоит из списка обозначений и сокращений, введения, пяти глав, заключения, списка литературы и двух приложений. Она изложена на 142-х страницах основного машинописного текста, содержит 53 рисунка, 10 таблиц и включает библиографию из 24-х наименований.

Основные результаты диссертации изложены в работах:

1. Лихачев A.C., Комплексный подход к анализу защищённости региональной платёжной системы. // Микроэлектроника и информатика - 2004. 11-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов. Тезисы докладов - М.:МИЭТ(ТУ), 2004.

2. Лихачев A.C., Низкоскоростные вокодеры в системах связи. // Микроэлектроника и информатика - 2005. 12-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов. Тезисы докладов -М.:МИЭТ(ТУ), 2005.

3. Лихачев A.C., Лупин С.А., Анализ и выбор алгоритмов для получения методики разработки низкоскоростных вокодеров. // Электроника и информатика - 2005. 5-я Международная научно-техническая конференция. Тезисы докладов - М.:МИЭТ(ТУ), 2005.

4. Лихачев A.C., Оценка качества цифровой обработки речи вокодерами с низкой скоростью передачи. // Микроэлектроника и информатика - 2006. 13-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов. Тезисы докладов. - М.:МИЭТ(ТУ), 2006.

5. Лихачев A.C., Оценка качества речепреобразования в низкоскоростных вокодерах. // Микроэлектроника и информатика - 2007. 14-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов. Тезисы докладов. - М.:МИЭТ(ТУ), 2007.

6. Лихачев A.C., Лупин С.А., Оценка качества речепреобразования в низкоскоростных вокодерах на этапах проектирования // Известия вузов. Электроника. - М. МИЭТ(ТУ), 2007, № 5.

7. Лихачев A.C., Модели возбуждения в низкоскоростных LPC вокодерах, // Техника и технология - М.: Компания Спутник +, 2007, № 5.

8. Лихачев A.C., Лупин С.А., Аналитические методы оценки качества низкоскоростных речепреобразующих устройств, // Техника и технология - М.: Компания Спутник +, 2007, № 5.

Похожие диссертационные работы по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК

Заключение диссертации по теме «Элементы и устройства вычислительной техники и систем управления», Лихачев, Александр Сергеевич

Основные результаты работы:

1. На основе проведенного анализа моделей параметрического кодирования речи определены основные критерии оценки характеристик низкоскоростного речепреобразования.

2. Предложена и обоснована структура ЬРС вокодеров с \УСЕ возбуждением от основного тона, позволяющая значительно повысить эффективность кодирования речи.

3. Обоснована актуальность создания методики автоматизированной оценки качества речепреобразования, как инструмента оперативного контроля на этапе разработки низкоскоростных речепреобразующих устройств, в дополнение к финальным аттестационным артикуляционным испытаниям согласно ГОСТ.

4. Разработан метод качественного анализа параметров низкоскоростных систем речепреобразования на основе сравнительной оценки сонограмм речевых сигналов.

5. Разработана методика объективной оценки искажений речи в элементах тракта низкоскоростного речепреобразования, основанная на сравнительном анализе динамических спектрограмм.

6. Разработан программный модуль, реализующий методику объективной оценки качества речепреобразования.

7. Проведены экспериментальные исследования предлагаемой методики на различных типах искажений речевого сигнала. Сравнение полученных данных с субъективной оценкой по методу артикуляционных испытаний подтвердило преимущество предлагаемой методики.

8. Разработанные методики внедрены, проверенны на практике и доказали свою эффективность.

Заключение

Список литературы диссертационного исследования кандидат технических наук Лихачев, Александр Сергеевич, 2007 год

1. ГОСТ Р 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений», М.: Издательство стандартов, 1997 г., 24 стр.

2. ГОСТ Р 50840-95 «Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости», М.: Издательство стандартов, 1995 г., 202 стр.

3. ГОСТ 16600-72 «Передача речи по трактам радиотелефонной связи. Требования к разборчивости речи и методы артикуляционных испытаний», М.: Издательство стандартов, 1972 г., 93 стр.

4. Фант Г. Акустическая теория речеобразования / Пер. с англ. М.: Наука, 1964.-284 с.

5. Фланаган Дж. Л. Анализ, синтез и восприятие речи / Пер. с англ. М.: Связь, 1968.-292 с

6. Калинцев Ю.К., «Разборчивость речи в цифровых вокодерах», М.:, "Радио и связь", 1991 г., 220 стр.

7. Ли Фэйпэн, «Разработка низкоскоростного вокодера»: Дис. канд. техн. наук: 01.04.13 М., 1999г., 150 стр.

8. Алдошина И.А., «Основы психоакустики» // http://auditech.ru/doc/psychoacoustics/indexl.htm

9. Дворянкин C.B., «Цифровая обработка изображений динамических спектрограмм аудио сигналов в задачах безопасности речевой связи», // "Специальная техника" № 3 2000 г., стр. 37 45.

10. Н.И. Серегин, «О собенности использования дискретного преобразования Фурье при спектральном анализе», Екатеринбург, Издательство ГОУ-ВПО УГТУ-УПИ, 36 стр.

11. Скляр Б., «Цифровая связь: теоретические основы и практическое применение (2-е изд)», М: Вильяме, 1104 стр.

12. А. Оппенгейм, Р. Шафер, «Цифровая обработка сигналов», М.: Техносфера, 2006 г., 856 стр.

13. Демидов О.Ф., Ишуткин Ю.М., Лихницкий A.M., «Восприятие фазовых искажений в области частоты основного резонанса головки громкоговорителя» // http://www.aml.nm.ru/perception.htm

14. Сапожков М. А., Михайлов В. Г. Вокодерная связь.-М.: Радио и связь 1983.

15. Иванов П., «Измеряемый голос», // http://www.osp.ru/nets/2004/08/151691/

16. Росляков A.B., Самсонов М.Ю., «Модели и методы оценки качества услуг ip-телефонии», // http://axenet.ru/stat/pokip.shtml

17. А. 10. Виноградов, «Оценка качества передачи речи по низкоскоростным каналам связи» // http://www.commerce.net.ua/news68942.html20. «Введение в QoS/SLM» // http://www.microtest.ru/

18. Дворянкин C.B., Макаров Ю.К., Хорев A.A., «Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам», // "Защита информации" № 2 2007 г.

19. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань, «Качество управления речевым трафиком в телекоммуникационных сетях», Москва, "Радио и связь", 2001 г., 105 стр.

20. Покровский Н.Б., «Расчет и измерение разборчивости речи», М.: Гос. Издательство литературы по вопросам связи и радио, 1962. 392 с.

21. В.К., Железняк, Ю.К. Макаров, A.A. Хорев «Некоторые методические подходы к оценке эффективности защиты речевой информации» // Специальная техника. М.: 2000. - № 4 - С. 39 - 45.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.