Методы и средства автоматизированного проектирования систем кодирования речи тема диссертации и автореферата по ВАК РФ 05.13.12, кандидат технических наук Коломиец, Ирина Александровна
- Специальность ВАК РФ05.13.12
- Количество страниц 162
Оглавление диссертации кандидат технических наук Коломиец, Ирина Александровна
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ.
ВВЕДЕНИЕ.
1. СОСТОЯНИЕ В ОБЛАСТИ ПРОЕКТИРОВАНИЯ СИСТЕМ КОДИРОВАНИЯ РЕЧИ.
1.1. Классификация алгоритмов кодирования речи.
1.2. Основные алгоритмы кодирования речи.
1.2.1. Кодирование формы сигнала.
1.2.2. Кодирование параметров сигнала (вокодеры).
1.2.3. Кодирование на основе метода «анализ-через-синтез».
1.3. Структуры систем кодирования речи.
1.3.1. G. 726 (АДИКМ).
1.3.2. GSM06.60 (ACELP).
1.3.3. GSM06.10 (RPE-LTP).
1.3.4. CDMA QCELP 8 (CELP).
1.3.5. G.723 (MP-MLQ).
1.4. Направления развития в области систем кодирования речи.
1.5. Характеристики систем кодирования речи.
1.6. Процесс проектирования систем кодирования речи.
1.7. Возможности систем автоматизированного проектирования.
1.7.1. Mathworks Matlab u Simulink.
1.7.2. Eagleware-Elanix System Vue.
1.7.3. National Instruments LabVIEW.
1.7.4. Agilent Advanced Design System.
1.8. Цель и постановка задач исследования.
1.9. Выводы.
2. РАЗРАБОТКА МЕТОДОВ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ СИСТЕМ КОДИРОВАНИЯ РЕЧИ.
2.1. Обобщенная модель системы кодирования речи.
2.2. Методика проектирования систем кодирования речи.
2.2.1. Системный уровень.
2.2.2. Функциональный уровень.
2.2.3. Компонентный уровень.
2.2.4. Поддержка принятия решений.
2.3. Библиотека блоков систем кодирования речи.
2.3.1. Определение требований к библиотеке.
2.3.2. Структура и состав библиотеки.
2.3.3. Структура блока библиотеки.
2.4. Выводы.
3. ИССЛЕДОВАНИЕ И ПРАКТИЧЕСКОЕ ВНЕДРЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ.
3.1. Структура подсистемы САПР (математическое, информационное и программное обеспечение).
3.2. Структура библиотеки.
3.3. Примеры блоков.
3.4. Модификация кодека G.726.
3.5. Выводы.
Рекомендованный список диссертаций по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК
Автоматизация проектирования систем цифровой фильтрации в базисах ПЛИС и заказных микросхем2008 год, кандидат технических наук Плотников, Павел Владимирович
Аппаратная реализация кодеков Рида-Соломона на плис на основе высокоуровневых параметризованных описаний функциональных узлов2012 год, кандидат технических наук Тайлеб ур. Мазуз Незхат
Подсистема САПР для моделирования и синтеза адаптивных узкополосных радиомодемов на базе ПЛИС2007 год, кандидат технических наук Шидловский, Дмитрий Юрьевич
Алгоритмическое и программное обеспечение системы для разработки кодеков помехоустойчивых кодов2008 год, кандидат технических наук Мальчуков, Андрей Николаевич
Методы и средства автоматизации тестопригодного проектирования смешанных интегральных схем2013 год, доктор технических наук Мосин, Сергей Геннадьевич
Введение диссертации (часть автореферата) на тему «Методы и средства автоматизированного проектирования систем кодирования речи»
В настоящее время наблюдается активное развитие и внедрение новых цифровых систем передачи звуковой информации (далее системы связи). Постоянно возрастающее число пользователей систем связи приводит к тому, что пропускная способность большинства каналов связи является недостаточной. Одним из путей увеличения пропускной способности каналов связи является сжатие передаваемой информации. Кроме этого следует отметить, что сокращение объемов передаваемых данных позволит увеличить количество пользователей канала связи и, следовательно, сократить стоимость услуг связи.
В современных системах передачи звуковой информации значительную часть передаваемых данных составляют речевые сообщения, для решения задачи увеличения пропускной способности каналов связи необходимо использовать в составе таких систем блок кодирования (сжатия) речевой информации, или кодек. При этом достигается еще один положительный эффект — обеспечение определенной степени защиты информации от несанкционированного доступа.
Таким образом, в настоящее время системы кодирования речи (речевые кодеки) являются неотъемлемой частью систем связи.
Использование в составе некоторой системы дополнительного сложного блока цифровой обработки данных приводит к появлению ряда проблем. Первая из них определяется спецификой блока кодирования речи и связана с тем, что сжатие информации в общем случае приводит к некоторым потерям данных, и следовательно, к снижению качества восстановленного сигнала. Решение этой проблемы приводит к использованию в качестве основы кодеков более сложных алгоритмов кодирования речи. Однако, чем сложнее алгоритм и, следовательно, система кодирования речи, тем большие вычислительные ресурсы требуются для ее реализации. Хотя острота указанной проблемы в последнее время сглаживается за счет интенсивного развития элементной (технической) базы, со сложностью алгоритма связана еще одна проблема обработка информации в дополнительном блоке приводит, соответственно, к дополнительным задержкам в передаче данных. Для простых алгоритмов задержка невелика - единицы миллисекунд, однако для сложных алгоритмов, обеспечивающих значительное сжатие и хорошее качество восстановленного сигнала, продолжительность задержки может составлять сотни, и даже тысячи миллисекунд, что вполне ощутимо при разговоре [33]. Следует отметить, что для обеспечения должного качества обслуживания современные стандарты связи строго ограничивают допустимую задержку кодирования и декодирования речевых данных.
Из вышесказанного следует, что основными требованиями, предъявляемыми к системам кодирования речи, являются требования к таким характеристикам, как качество восприятия восстановленной информации, коэффициент сжатия, задержки кодирования/декодирования и вычислительная сложность алгоритмов. Дополнительные требования, предъявляемые к аппаратной реализации кодеков, связаны со снижением энергопотребления и массо-габаритных размеров устройства, в состав которого они входят.
Таким образом, при проектировании системы кодирования речи решается задача обеспечения как взаимосвязанных, так и независимых требований. Степень выполнения этих требований можно оценить только имея законченную реализацию кодека.
Современный подход к проектированию систем кодирования речи обеспечивает достижение требований к кодеку путем последовательного выполнения следующих шагов: выбор соответствующего алгоритма кодирования речи, варьирование структуры системы, связанное с выбором алгоритма реализации отдельного блока, и варьирование параметров блоков. В случае неудовлетворительного результата возможен возврат на любой из указанных шагов. Следовательно, проектирование кодека представляет собой многоитерационный процесс, причем значительная часть итераций носит вложенный характер.
При таком подходе основным недостатком является высокая трудоемкость процесса проектирования кодека и связанные с этим большие временные затраты на разработку. В худшем случае для достижения указанных в требованиях на проектирование системы кодирования речи характеристик требуется перебор всех приемлемых вариантов структуры. Порядок следования вариантов и ограничения их применения в каждом конкретном случае определяются разработчиком на основе его опыта и квалификации, при этом используются эвристические методы. Различные реализации каждого блока объективно имеют различную структуру выходных данных, которая влияет на структуру, а зачастую и на принципы функционирования одного или нескольких других блоков. Так, например, эффективность предсказания сигнала определяет статистические характеристики сигнала погрешности предсказания, от которых зависит структура (количество уровней и интервалы, принципы адаптации и др.) квантователя уровня сигнала; в то же время порядок предсказания (количество коэффициентов предсказания, точность их представления и др.) влияют на структуру квантователя параметров сигнала. Неотъемлемыми частями блоков квантования уровня сигнала и параметров сигнала являются кодовые книги и таблицы квантования. Формирование и расчет кодовых книг и таблиц квантования представляют собой один из самых трудоемких этапов проектирования речевого кодека: необходимо набрать статистическую информацию по типовым сигналам, с которыми они будут работать, выделить наборы характерных признаков, разработать эталонные векторы признаков типовых сигналов и т.п. Следовательно, при любом изменении характеристик входных для данных блоков сигналов необходимо заново проектировать кодовые книги и таблицы квантования.
На сегодняшний день маршрут проектирования систем кодирования речи включает в себя разработку и отладку математических моделей на алгоритмических языках высокого уровня, проведение ряда мероприятий для адаптации используемых данных, кодовых книг и таблиц квантования к аппаратной реализации и затем создание описания кодека на языке описания аппаратуры. Это связано в первую очередь с тем, что большинство алгоритмов предметной области представлено в виде математических моделей. Необходимость перехода от математического описания к программной модели и тем более к аппаратной модели требует от разработчиков опыта, значительной квалификации и глубоких знаний не только в области речевых кодеков, но и принципов, технологий программирования на языках высокого уровня и языках описания аппаратуры. Подобное сочетание требований не всегда является обеспечиваемым и эффективным, поэтому в процессе проектирования систем кодирования речи участвуют как минимум специалист по обработке речевых сигналов и программист, между которыми необходима тесная связь на каждой итерации процесса проектирования. Подготовка документации, согласование работы между различными специалистами приводит к дополнительным временным затратам. Поскольку, как было показано выше, процесс проектирования кодеков носит многоитерационный характер и немалая часть итераций связана с изменением параметров блоков, подобные временные затраты становятся неоправданными и снижают эффективность разработки.
Кроме этого, на сегодняшний день для реализации большинства отдельных блоков кодеков известно множество альтернативных реализаций, основанных на различных алгоритмах и подходах, и это множество постоянно растет за счет интенсивного развития области речевого кодирования. В зависимости от квалификации и опыта разработчика от его внимания может ускользать значительное число возможных проектных решений и, следовательно, разработанный кодек может иметь более низкое качество, относительно потенциально возможного.
Повысить качество проектного решения и снизить время разработки можно путем использования в процессе проектирования речевых кодеков систем автоматизированного проектирования (САПР), предоставляющих пользователю множество альтернативных реализаций различных блоков систем кодирования речи. Анализ современных средств автоматизированного проектирования цифровых систем передачи звуковой информации позволил выделить САПР, содержащие в своем составе библиотеки блоков речевых кодеков. Однако множество предлагаемых блоков исключительно мало и ограничивается блоками, реализующими стандарты современных систем связи. Более того, большинство из этих блоков — закрытые готовые реализации стандартных кодеков (в виде «черного ящика»). Исследование и возможность модификации оставшейся части блоков ограничиваются структурным уровнем, алгоритмы отдельных элементов не доступны пользователю, что не позволяет вносить в них какие-либо изменения, и тем более разработать новый кодек. Из выше сказанного следует, что в настоящее время является актуальным решение задачи автоматизации процесса проектирования систем кодирования речи с использованием библиотеки отдельных функциональных блоков открытых по отношению к модернизации и расширению. Цель работы и задачи исследований.
Целью работы является разработка методов автоматизированного проектирования систем кодирования речи и создание на их основе пакета прикладных программ, предназначенного для решения данной задачи. Для достижения данной цели в работе ставятся и решаются следующие основные задачи:
1. Исследование и анализ алгоритмов кодирования речи.
2. Исследование существующих систем кодирования речи.
3. Исследование существующих подходов к проектированию систем кодирования речи, возможностей современных САПР для решения данной задачи.
4. Разработка обобщенной модели системы кодирования речи, включающей множество альтернативных алгоритмов функциональных блоков на разных уровнях детализации, и способов ее представления в базе знаний.
5. Разработка методики автоматизированного проектирования систем кодирования речи, направленной на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
6. Разработка математического, информационного и программного обеспечения подсистемы САПР, позволяющей формировать структурную и функциональную модели кодека и оценивать характеристики полученного решения.
Научная новизна работы. Новые научные результаты, полученные в работе, состоят в следующем:
1. Разработана обобщенная модель системы кодирования речи, предложен способ ее представления в базе знаний в виде совокупности двух И-ИЛИ-деревьев.
2. Предложена методика автоматизированного проектирования систем кодирования речи, направленная на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
Практическая ценность работы. На основе предложенных методов автоматизированного проектирования систем кодирования речи была разработана специализированная подсистема САПР, позволяющая сократить временные затраты на разработку речевых кодеков и повысить качество проектируемого устройства кодирования речи. Библиотека базовых блоков подсистемы САПР выполнена по технологии динамически подключаемых библиотек (DLL) и может быть использована в сторонних САПР, позволяющих проектировать функциональные модели устройств и поддерживающих подключение пользовательских модулей. Открытость архитектуры подсистемы и возможность ее взаимодействия с другими САПР позволяют включать новые модули. Разработанная подсистема САПР позволяет моделировать и исследовать существующие системы кодирования речи, исследовать отдельные структурные блоки кодеков, создавать модели новых систем кодирования речи. Возможность замены блоков существующего кодека блоками с другой реализацией той же функции и настройка каждого параметра блока позволяют с малыми временными затратами найти эффективное техническое решение.
Реализация и внедрение результатов работы.
Работа по теме диссертации проводилась на кафедре ВТ ВлГУ в Центре микроэлектронного проектирования и обучения в рамках госзаказа по контрактам НИОКР № 2852/03, № 2879/03, 2992/03. Полученные результаты исследований в виде методик, программного обеспечения и моделей устройств внедрены в виде материалов отчетов по НИР и ОКР, выполненных в рамках госзаказа, и в учебный процесс кафедры ВТ ВлГУ. На защиту выносятся.
1. Обобщенная модель системы кодирования речи, способ ее представления в базе знаний в виде совокупности двух И-ИЛИ-деревьев.
2. Методика автоматизированного проектирования систем кодирования речи, направленная на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
3. Библиотека блоков систем кодирования речи.
4. Математическое, информационное и программное обеспечение подсистемы САПР, позволяющей формировать структурную и функциональную модели кодека и оценивать характеристики полученного решения.
5. Результаты применения подсистемы САПР для исследования и модификации кодека G.726 (АДИКМ).
Апробация работы.
Основные положения и результаты работы докладывались и обсуждались на следующих семинарах и конференциях:
Международная научно-техническая конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2002 г.); Всероссийская НТК «Реконфигурируемые электронные средства в системах обработки информации» (Владимир, 2002 г.);
Международная научно-техническая Конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2003 г.); East-West Design and Testing Symposium (Crimea, Ukraine, 2004 г.); Международная научно-техническая Конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2004 г.); VII международная научно-техническая конференция «Перспективные технологии в средствах передачи информации» (Владимир, 2005 г.);
6-я ежегодная выставка «Информационные технологии' 2005», экспонат «Модифицированный АДИКМ-кодек» (Владимир, 2005 г.) НТК профессорско-преподавательского состава ВлГУ (2002-2005г); Научно-практические семинары Центра микроэлектронного проектирования и обучения ВлГУ (2002 - 2005 г).
Публикации по работе. По теме диссертации опубликовано 13 печатных работ, из них одна статья в сборнике научных трудов, одно свидетельство об официальной регистрации программы для ЭВМ и одиннадцать тезисов докладов на Международных и Российских научно-технических конференциях.
Структура работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы и приложений. Общий объем диссертации 161 страница, в том числе 142 страницы основного текста, 11 страниц списка литературы (105 наименований), 8 страниц - приложения. Диссертация содержит 62 рисунка и 20 таблиц.
Похожие диссертационные работы по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК
Разработка методов эффективного кодирования речи на основе новых моделей источника речеобразования2007 год, кандидат технических наук Медведев, Олег Николаевич
Компрессия цифровых изображений на основе векторного квантования и контекстного кодирования в области дискретных преобразований2011 год, кандидат физико-математических наук Коплович, Дмитрий Михайлович
Модели, методы и алгоритмы кодирования изображений в устройствах систем на кристалле2011 год, доктор технических наук Фахми, Шакиб Субхиевич
Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных2013 год, кандидат технических наук Рубина, Ирина Семеновна
Адаптивное скалярное квантование спектральных коэффициентов для систем сжатия аудио сигналов2009 год, кандидат технических наук Поров, Антон Викторович
Заключение диссертации по теме «Системы автоматизации проектирования (по отраслям)», Коломиец, Ирина Александровна
3.5. Выводы
1. Разработана подсистема САПР речевых кодеков, позволяющая формировать функциональную модель системы кодирования речи и получать оценку ее характеристик. Подсистема САПР кодеков интегрирована в систему функционального моделирования System Vue.
2. Математическое обеспечение подсистемы САПР кодеков соответствует разработанным и описанным в главе 2 математической модели обобщенной модели кодеков и методике автоматизированного проектирования систем кодирования речи, а также математическим моделям блоков систем кодирования речи, и реализовано в виде библиотеки блоков, подключаемой к системе System Vue.
3. Информационное обеспечение подсистемы САПР кодеков состоит из базы знаний, описывающей структуры И-ИЛИ-деревьев обобщенной модели системы кодирования речи, библиотеки базовых блоков и макроблоков и описания методики автоматизированного проектирования систем кодирования речи.
4. Предложена структура данных базы знаний, соответствующая способу представления обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьев и обеспечивающая поддержку принятия решений.
5. Предложен способ подключения разработанной библиотеки блоков кодеков к системе System Vue, не требующий изменений блоков. Соответствие интерфейсов обеспечивается отдельным модулем (интерфейсная часть), поддерживающим стандарт System Vue. Функции данного модуля принимают входные данные, обрабатывают настройки параметров, выполняют преобразование форматов данных и передают управление соответствующей процедуре блока, размещенной непосредственно в модуле разработанной библиотеки (функциональная часть), затем формируют выходные данные в формате System Vue. Таким образом, обеспечивается переносимость библиотеки кодеков в любую САПР, для этого требуется только изменить интерфейсный модуль под стандарт новой системы и не затрагивать функциональную часть.
6. Предложена структура элемента библиотеки блоков кодеков для использования в системе System Vue, соответствующая разработанной структуре блока библиотеки в виде фрейма (п.2.3.3) и принципам разделения интерфейсной и функциональной частей. Приведены примеры блоков, использующихся в структуре кодека G.726 (АДИКМ).
7. Программное обеспечение подсистемы САПР кодеков состоит из двух модулей динамически подключаемых библиотек, представляющих собой интерфейсную и функциональную части библиотеки блоков кодеков, двух файлов XML-формата базы знаний и модуля редактирования базы знаний, обеспечивающего удобный пользовательский интерфейс.
8. С помощью разработанной подсистемы САПР выполнена модификация кодека G.726 с целью улучшения его технических характеристик. Модифицированный кодек превосходит стандартный по качеству восстановленного сигнала и обладает более высоким динамическим диапазоном. Приведены результаты экспериментов с использованием сигналов с различными характеристиками. Была выполнена оптимизация сгенерированного подсистемой САПР VHDL-кода под ПЛИС серии Spartan, который использовался для изготовления рабочего макета аппаратного кодека. Испытания подтвердили заявленные характеристик и параметры макета.
ЗАКЛЮЧЕНИЕ
Анализ алгоритмов кодирования речи и соответствующих им систем кодирования речи показал, что в общем случае речевой кодек имеет сложно подчиненную структуру, в которой структура одного блока сильно влияет на структуру, а иногда и на принципы функционирования одного или нескольких других блоков. Для достижения желаемых характеристик кодека необходимо при проектировании выполнить не одну итерацию, связанную со структурной или параметрической оптимизацией системы кодирования речи. Таким образом, процесс проектирования систем кодирования речи носит многоитерационный характер и отличается высокими временными затратами. Использование САПР или подсистем САПР, специально ориентированных на проектирование данного класса систем, позволит значительно повысить эффективность разработки речевых кодеков: сократить время разработки за счет использования настраиваемых моделей блоков кодеков и повысить качество готового проектного решения за счет использования базы знаний, предоставляющей разработчику множество альтернативных алгоритмов реализаций каждого блока. Анализ современных САПР показал, что на сегодняшний день не существует специализированных систем автоматизированного проектирования, ориентированных на разработку речевых кодеков.
Возможности проектирования систем кодирования речи с помощью универсальных САПР определяются предоставляемыми ими блоками цифровой обработки сигналов, однако время, затрачиваемое на разработку, по-прежнему неоправданно велико. Кроме этого, данные САПР предоставляют далеко не все возможные модели блоков, использующихся в составе систем кодирования речи. Некоторые САПР с помощью пакетов расширения, ориентированных на проектирование систем телекоммуникаций, предоставляют готовые модели речевых кодеков современных стандартов связи, однако возможности их модификации ограничены структурным уровнем и алгоритмы их элементов не доступны пользователю. Все это снижает эффективность разработки систем кодирования речи и ограничивает ее качество.
В диссертационной работе поставлены и решены задачи, направленные на создание методов и средств автоматизированного проектирования систем кодирования речи.
В работе были получены следующие основные результаты.
1. Исследованы алгоритмы кодирования речи и проанализированы основанные на них системы кодирования речи современных стандартов связи. Определены основные этапы проектирования речевых кодеков; определены характеристики кодеков, являющиеся основой критериев качества систем кодирования речи. Выделены общие и специфические функциональные блоки различных классов систем кодирования речи.
2. Проведенный анализ алгоритмов и методов цифровой обработки сигналов для выделенных блоков привел к формированию набора базовых блоков и набора макроблоков систем кодирования речи, из которых можно построить функциональную модель кодека и получить оценку его характеристик.
3. Сформированы множества альтернативных алгоритмов реализаций функциональных блоков на разных уровнях детализации, основываясь на том, что в различных кодеках блок, выполняющий одну и ту же функцию, может реализовывать разные алгоритмы цифровой обработки сигналов.
4. Разработана обобщенная модель системы кодирования речи, представляющая собой иерархическую структуру кодека в совокупности с альтернативными вариантами реализации каждого блока.
5. Предложено представление обобщенной модели кодека в базе знаний в виде совокупности двух И-ИЛИ-деревьев: основное дерево отражает множество альтернативных решений функциональных блоков; дополнительное дерево используется при определении запрещенных сочетаний блоков. Для поддержки принятия решения при выборе одного из альтернативных решений каждая вершина основного дерева содержит набор характеристик-признаков, определяемых методом экспертной оценки.
6. Предложен математический аппарат обработки двух видов представления обобщенной модели кодека на основе теории множеств и теории графов.
7. Разработана методика автоматизированного проектирования систем кодирования речи, направленная на синтез структуры и формирование функциональной модели кодека с использованием библиотеки блоков. Синтез модели кодека происходит путем выделения частной структуры из обобщенной модели системы кодирования речи; оптимизация - на основе поиска оптимального решения, используя И-ИЛИ-дерево обобщенной модели, и на основе настраиваемых параметров блоков. Методика предполагает рассмотрение процесса проектирования на трех уровнях: системном, функциональном и компонентном.
8. Предложены состав и структура библиотеки блоков систем кодирования речи. Состав библиотеки соответствует множеству вершин типа И и множеству листьев основного дерева обобщенной модели системы кодирования речи. Библиотека состоит из библиотеки макроблоков, библиотеки базовых блоков, сгруппированных по выполняемой функции, библиотеки кодовых книг и таблиц квантования.
9. Предложена структура блока библиотеки, обеспечивающая поддержку предложенной методики проектирования кодеков. Блок библиотеки представляет собой фрейм, объединяющий декларативную и процедурную части.
10. Разработано математическое, информационное и программное обеспечение, реализованное в подсистеме САПР речевых кодеков, позволяющей формировать функциональную модель системы кодирования речи и получать оценку ее характеристик. Подсистема САПР кодеков интегрирована в систему функционального моделирования System Vue.
11. Предложена структура базы знаний, соответствующая способу представления обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьев и обеспечивающая поддержку принятия решений.
12. Проведено исследование предложенных решений при выполнении ряда заказных НИОКР, в том числе при модификации кодека G.726 с целью повышения его технических характеристик. Модифицированный кодек превосходит стандартный по качеству восстановленного сигнала и обладает более высоким динамическим диапазоном.
Разработанные методы автоматизированного проектирования речевых кодеков применимы для создания как самостоятельной системы, так и подсистемы любой из сторонних сред проектирования (САПР или среды проектирования на языках высокого уровня), позволяющих разрабатывать и подключать пользовательские библиотеки.
Список литературы диссертационного исследования кандидат технических наук Коломиец, Ирина Александровна, 2005 год
1. Автоматизация проектирования цифровых устройств/ Баранов С.И., Майоров С.А., Сахаров Ю.П. Селютин В.А. JL: Судостроение, 1979, 261 с.
2. Автоматизация схемотехнического проектирования: Учеб. пособие для вузов / Ильин В.Н., Фролкин В.Т., Бутко А.И. и др.; Под ред. Ильина В.Н. М.: Радио и связь, 1987. - 368 с.
3. Адаптивные фильтры: пер. с англ. /Под ред. К.Ф.Н. Коуэна и П.М. Гранта. М.: Мир, 1988.
4. Афанасьев А.А. Адаптивный кодек речевых сигналов на основе систем с переменной структурой // Материалы 4-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2002. Москва, 2002 г.
5. Афанасьев А.А., Пищальников А.В. Система адаптивного кодирования речевых сигналов // Материалы 5-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2003. Москва, 2003 г.
6. Барков И. Некоторые аспекты технологии 1Р-телефонии. http://www.ixbt.com/comrri/ip-aspects.html.
7. Басаргин А.С., Коломиец И.А. Программные модели прямого канала CDMA // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 81 -83.
8. Басаргин А.С., Коломиец И.А. Учебная подсистема САПР функционально-логического проектирования // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 21- 23.
9. Бернюков А.К. Дискретная и цифровая обработка информации. Введение в теорию и некоторые приложения: Уч. пособие/ ВлГУ. -Владимир, 1990.
10. Борзенко А. Системы на одном кристалле. // "PC Week" №44, 1999, , с. 24-30.
11. Варламова О. Помехоустойчивые кодеки будущее цифровой телефонии. // "Сети и системы связи" - №10, 1997, с. 26-32 .
12. Владимирова Н.В., Коломиец И.А. Основные особенности турбо-кодов // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2003 г.
13. Вокодерная телефония. Методы и проблемы. /Под ред. А.А. Пирогова. -М: Связь, 1974.
14. Ворсано Давид. Кодирование речи в цифровой телефонии. // "Сети и системы связи" №8, 1996, с.24-27.
15. Гемитерн В.И., Каган Б.М. Методы оптимального проектирования. -М.: Энергия, 1984 г.
16. Гольденберг JL М. и др. Цифровая обработка сигналов: Учеб. пособие для вузов. -2 изд., перераб. и доп. М.: Радио и связь, 1990.
17. Гофман В.Э., Хомоненко А.Д. Delphi 5. СПб.: БХВ - Санкт-Петербург, 1999.-800 с.
18. Губанов Д.А., Стешенко В.Б., Храпов В.Ю., Шипулин С.Н. Перспективы реализации алгоритмов цифровой фильтрации на основе ПЛИС фирмы ALTERA. // "Chip News" № 9,10, 1997, с. 26-33.
19. Губанов ДА., Стешенко В.Б., Шипулин С.Н. Современные алгоритмы ЦОС: перспективы реализации. // "Электроника: наука, технология, бизнес" №1, 1999, с.54-57.
20. Кириллов С.А., Лоцманов А.А. Дифференциальная импульсно-кодовая модуляция с нелинейным адаптивным фильтром-предсказателем // Материалы 5-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2003. Москва, 2003 г.
21. Кобелев В.Ю. Адаптивное вейвлет-преобразование сигналов // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
22. Кодирование речи, http://www.protei.ru/teor/iptel/ipspeak/kodek.html.
23. Коломиец И.А. Владимирова Н.В. Развитие кодов, корректирующих ошибки // 5-я международная научно-техническая конференция ПТСПИ'2003 «Перспективные технологии в средствах передачи информации», Владимир, 1-4 июля 2003г, с. 223-225
24. Коломиец И.А. Методика проектирования систем кодирования речи // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2002 г.
25. Коломиец И.А. Постановка задачи оптимизации при проектировании систем кодирования речи // 7-я международная научно-техническая конференция ПТСПИ'2005 «Перспективные технологии в средствах передачи информации», Владимир, 22 апреля 2005г.
26. Коломиец И.А. Проектирование систем кодирования речи на основе библиотеки макроблоков и базовых блоков // 7-я международная научно-техническая конференция ПТСПИ'2005 «Перспективныетехнологии в средствах передачи информации», Владимир, 22 апреля 2005г.
27. Коломиец И.А. Развитие алгоритмов кодирования речи // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2003 г.
28. Коломиец И.А., Басаргин А.С. Состав библиотеки моделей алгоритмов построения систем кодирования речи // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 168 —171.
29. Коломиец И.А., Коблов Е.Б., Куликов К.В. Research of the speech signal prediction // East-West Design and Testing Symposium. Crimea, Ukraine, September, 2004.
30. Коломиец C.A., Коломиец И.А., Ланцов B.H. Design of ADPCM-codec on FPGA basis // East-West Design and Testing Symposium. Crimea, Ukraine, September, 2004. - P. 152 - 156.
31. Крейнес А. Как налить море в наперсток? Технологии компрессии голоса. // "Сети и системы связи" №9,10, 1996, с. 119-121.
32. Ланнэ А.А. Новая теория линейных спектральных корней // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
33. Ланцов В.Н., Коломиец И.А. Реализация подсистем кодирования -декодирования речи в базисе ПЛИС // Всероссийская НТК «Реконфигурируемые электронные средства в системах обработки информации», Владимир, 2002 г., с. 38 40.
34. Маркел Дж., Грэй А. Линейное предсказание речи. М.: Связь, 1980. -308 с.
35. НИР № 2879/03. Исследование путей совершенствования тактико-технических характеристик аппаратуры цифровой регистрации речевой информации.
36. НИР № 2852/03. Разработка программно-аппаратных средств обработки речевого сигнала с применением адаптивной дифференциальной импульсно-кодовой модуляции.
37. Новосельский А. И звукам не тесно, и мыслям просторно. http://softlab.od.ua/algo/dsp/spech-compress.htm
38. Норенков И.П. Разработка систем автоматизированного проектирования. Учебник для вузов. М.: Изд-во МГТУ им. Н.Э. Баумана, 1994.-207 с.
39. Норенков И.П., Маничев В.Б. Системы автоматизированного проектирования электронной и вычислительной аппаратуры: Учеб. пособие для вузов. М.: Высш. школа, 1983. — 272 с.
40. ОКР № 2992/03. Разработка и изготовление специализированного кодека для аппаратуры регистрации цифровым методом.
41. Рабинер JL, Гоулд Б. Теория и применение цифровой обработки сигналов. М: Мир, 1978.
42. Рабинер J1.P., Шафер Р.В. Цифровая обработка речевых сигналов. М: Радио и связь, 1981.
43. Разработка программы распознавания русской речи для процессора SuperH RISK http://leader.cs.msu.su/~luk/ContinuousSpeechrus.html.
44. Разработка САПР. В 10 кн. Кн. 2. Системотехнические задачи создания САПР: Практ. пособие/ А.Н. Данчул, Л.Я. Полуян; Под ред. А.В. Петрова М.: Высш. шк., 1990 - 144 с.
45. Ратыжский М.В. Основы сотовой связи./ Под ред. Зимина Д.Б. М.: Радио и связь, 2000, 248 с.
46. Свидетельство об официальной регистрации программы для ЭВМ № 2004610928. Система воспроизведения речевых сигналов. Авторы Ефимов В.Г., Гусев Е.В., Коломиец И.А. Зарегистрировано в Реестре программ для ЭВМ 16 апреля 2004 г. (г. Москва).
47. Справочник по математике для научных работников и инженеров. Корн Г., Корн Т. М.: Наука, 1984.
48. Стукалов Д.Н. Кластеризация параметров речевого сигнала с учетом их динамических характеристик // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
49. Теоретические основы САПР: Учебник для вузов / Корячко В.П., Курейчик В.М., Норенков И.П. М.: Энергоатомиздат, 1987. - 400 с.
50. Уидроу Б., Стирнз С. Адаптивная обработка сигналов: Пер. с англ. — М.: Радио и связь, 1989. 440 с.
51. Хартов В.Я. Автоматизация функционально-логического проектирования цифровых приборов и устройств. — М.: Машиностроение, 1978. 52 с.
52. Цифровая обработка сигналов / А.Б. Сергиенко СПб.: Питер, 2002. -608 с.
53. Яблонский С.В. Введение в дискретную математику: Учебн. Пособие для вузов. -М.: Наука. Гл. ред. физ.-мат. лит., 1986. 384 с.
54. A. Chandrakasan, S.Sheng, R. Brodersen. Low-power CMOS digital design. // IEEE J.Solid-State Circ., vol. 27, No. 4, pp. 473-484, Apr. 1992.
55. A.Spanias. Speech coding. Proc. IEEE, vol. 82, pp. 1541-1582, Oct. 1994.
56. Akira Takahashi, Hideaki Yoshino. Perceptual QoS Assessment Technologies for VoIP // IEEE VOICE OVER IP AND QUALITY OF SERVICE, Vol.42, № 7, July 2004, pp. 28-34.
57. Alan V. Oppenheim, Roland W. Schafer, John R. Buck. Discrete-time signal processing. Prentice-Hall International, 1999.
58. Allen Gersho, Erdal Paksoy. An overview of Variable Rate Speech Coding for cellular network. Proc. of the Int. Conf. On Selected Topics in Wireless Communications, 1992, Vancouver, B.C., Canada.
59. Chandrakasan, R. Brodersen. Minimizing power consuption in digital CMOS circuits. Proc. IEEE, vol. 83, pp. 498-523, Apr. 1995.
60. Ciaran McElroy. Introduction to many types of speech coding. http://www.dsp.ucd.ie/speech/tutorial/speechcoding/ speechtut.html
61. D. Massaloux, S. Proust. Special shaping in the proposed ITU-T 8kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1995, pp. 9-10.
62. DSP Cores for Mobile Communications: Where are we going?, Gerhard Fettweis, Mobile Communications Systems, Dresden University of Technology, D-01062 Dresden.
63. E. Paskoy, K. Srinivasan, A. Gersho. Variable Rate CELP Coding of Speech with Phonetic Classification. European Transactions on Telecommunications, September, 1984.
64. E. Yuen, P. Но, V. Cuperman. Varible Rate Speech and Channel Coding for Mobile Communications. Proc. 43rd IEEE/VTS Vehicular Technology Conference, 1994.
65. F.Weller. Программные средства проектирования устройств цифровой обработки сигналов. // "Electronic Engineering Times" N32, 1995, с.40-41.
66. GSM 06.10 (ETS 300 580-2). Digital cellular telecommunications system (Phase 2); Full rate speech. European Telecommunications Standards Institute, 2000.
67. GSM 06.20 (ETS 300 581-2). Digital cellular telecommunications system (Phase 2); Half rate speech. European Telecommunications Standards Institute, 1998.
68. GSM 06.60 (ETSI EN 301 245). Digital cellular telecommunications system (Phase 2); Enhanced Full Rate (EFR) speech transcoding. European Telecommunications Standards Institute, 2000.
69. I. Gerson, M. Jasiuk. Vector sum excited linear prediction (VSELP) speech coding at 8 kbits/s. Proc. ICASSP-90, Apr. 1990, pp. 461-464.
70. I.A. Greson, M.A.Jasiuk. Vector Sum Excited Linear Prediction (VSELP) speech coding at 8 kb/s. Proc. ICASSP '90, Albuquerque, pp. 461-464.
71. ITU Coding Standards. http://www.itu.ch/itudoc/itu-t/rec/g/g700-799.html
72. ITU-T Recommendation G.711. General aspects of digital transmission systems; terminal equipments. Pulse Code Modulation (PCM) of voice frequencies. International Telecommunication Union, Telecommunication Standardization Sector, 1988, 1993.
73. ITU-T Recommendation G.723.1. Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbits/s. International Telecommunication union, Telecommunications Standardization Sector, 1996.
74. ITU-T Recommendation G.729. Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic Code-Excited Linear-Prediction (CS-ACELP). International Telecommunication union, Telecommunications Standardization Sector, 1995.
75. ITU-T Recommendation P.800. Mean Opinion Score (MOS). International Telecommunication union, Telecommunications Standardization Sector, 1996.
76. ITU-T Recommendation P.861. Perceptual Speech Quality Measurement (PSQM). International Telecommunication union, Telecommunications Standardization Sector, 1996.
77. ITU-T Recommendation P.862. Perceptual Evaluation of Speech Quality (PESQ). International Telecommunication union, Telecommunications Standardization Sector, 1996.
78. J. H. James, Bing Chen, Laurie Garrison. Implementing VoIP: A Voice Transmission Performance Progress Report // IEEE VOICE OVER IP AND QUALITY OF SERVICE, Vol.42, № 7, July 2004, pp. 36-41.
79. J. Hennesy, D. Patterson. Computer Architecture: A Quantitative Approach. San Francisco, С A: MorganKaufmann, 1996.
80. J.D. Markel, A.H. Gray, Jr. Linear prediction of speech. Springer-Verlag, New York, NY, 1976.
81. J.J. Dubnowski, R.E.Crochier. Variable Rate Coding of Speech. // "Bell systems Technical Journal", March, 1979, vol. 58, pp. 557-600.
82. Jason Woodard. Introduction to speech coding plus information on a series of speech coding standards. http://www-mobile.ecs.soton.ac.uk/ speechcodecs/index.html
83. K. Jarvinen, J. Vainio, P. Kapanen, T. Honkanen, P. Haavisto, R. Salami, C. Laflamme, J-P. Adoul. GSM Enhanced Full Rate Speech Codec. Proceedings of the 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '97).
84. Kataoka et al. LSP and gain quantization for the proposed ITU-T 8 kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1995, pp.7-8.
85. L.R. Rabiner, R.W. Shafer. Digital processing of speech signals. Prentice-Hall, Englewood Cliffs, NJ, 1978.
86. Lei Zhang, Tian Wang, Vladimir Cuperman. A CELP Variable Rate Speech Codec with low average rate. Proceedings of the 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '97).
87. M. Rajesh. Low Power Architectures for the IS-54 VSELP Algorithm, MS thisis, Arizona State University, Tempe, Arizona, 1995.
88. Makhoul J., Roucos S., Gish H. Vector Quantization in Speech Coding // IEEE v.73, № 11, 1985.
89. N. Weste, K.Eshragian. Principles of CMOS VLSI Design: A Systems Perspective. Reading, MA: Addison-Wesley, 1988.
90. P. Jacobs, W. Gardner. "QCELP": A Variable Rate Speech Coder for CDMA Digital Cellular Systems. // Speech and Audio Coding for Wireless and Network Applications, edited by B.S. Atal, V. Cuperman and A. Gersho, Kluwer Academic Publishers, 1993.
91. R. Salami et al. Description of the proposed ITU-T 8 kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1999, pp. 3-4.
92. Russell E. Henning, Chaitali Chakrabarti. High-Level Design Synthesis of a Low Power, VLIW Processor for the IS-54 VSELP Speech Encoder. Proceedings of the 1997 International Conference on Computer Design (ICCD '97).
93. The Programmable Logic Data Book. Xilinx, Inc., 1999
94. TIA/EIA/IS-127. Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital Systems. Interim Standart.
95. Telecommunications Industry Association, Electronic Industries Alliance, 1997.
96. TIA/EIA/IS-96-B. Speech Service Option Standart for Wideband Spread Spectrum Systems. Interim Standart. Telecommunications Industry Association, Electronic Industries Alliance, 1996.
97. V. Cuperman, P. Lupini. Variable Rate Speech Coding. // "Modern methods of speech processing '1995", pp. 101-120.
98. V. Madisetti. VLSI Signal Processors: An Introduction to Rapid Prototyping and Design Synthesis. Boston, MA: Butterworth-Heinemann, 1995.
99. Y. Yatsuzuka, S. Lizuka, T. Yamazaki. A Variable Rate Coding by APC with Maximum Likelihood Quantization from 4.8 kbit/s to 16 kbit/s. Proc. IEEE ICASSP, 1986, pp. 3071-3074.
100. МЕТОДИКА ПРОЕКТИРОВАНИЯ РЕЧЕВОГО КОДЕКА1. Начало1. Алгоритмыкодир. речи1. Библиотека макроблоков1. Ai
101. Библиотека л эазовых блоков.1. Библиотека кодовых книг1. Расчет кодовых книги таблиц квантования1. Оптимизациятаблиц квантования
102. Определение требований к разрабатываемому кодеку: 1) среда передачи, виды сигналов3. скорость цифрового потока4. качество восстан.сигнала5. задержка кодирования6. сложность алгоритма8. требования к реализации
103. Исследование и анализ сигналов и среды функционирования
104. Выбор алгоритма кодирования речи
105. Разработка структурной схемы кодека(набор макроблоков)
106. Декомпозиция структурной схемы (формирование набора базовыхблоков)
107. Выбор реализаций отдельных базовых блоков
108. Принятие решений о дальнейших действиях
109. Модификация существующих или составление и новых кодовых книг и таблиц квантования
110. Составление функциональноймодели кодека *
111. Моделирование и анализ характеристик кодека
112. Принятие решений о дальнейших действиях
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.