Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных тема диссертации и автореферата по ВАК РФ 05.13.01, доктор технических наук Белов, Сергей Павлович
- Специальность ВАК РФ05.13.01
- Количество страниц 449
Оглавление диссертации доктор технических наук Белов, Сергей Павлович
ВВЕДЕНИЕ.9
ГЛАВА 1. МЕТОДЫ И АЛГОРИТМЫ ОБРАБОТКИ РЕЧЕВЫХ И КАНАЛЬНЫХ СИГНАЛОВ ПРИ ХРАНЕНИИ И ПЕРЕДАЧЕ РЕЧЕВЫХ ДАННЫХ В ИТС. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЙ.24
1.1Проблема минимизации затрат ресурсов ИТС при хранении и передаче речевых данных.24
12 Процедуры регистрации, хранения и передачи речевых данных с применением компьютерных средств.29
1.3 Модели речеобразования и восприятия звуков речи слуховой системой человека, как основа сжатия речевых данных.36
1.4 Методы и алгоритмы обработки речевых данных, уменьшающих объемы их битовых представлений при хранении и передаче.50
1.5 Распределение частотно-временных ресурсов ИТС при передаче речевых данных.59
1.6 Задачи исследований.75
ГЛАВА 2. РАЗРАБОТКА И ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ
ОСНОВ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ.79
2.1 Субполосные представления в задачах обработки речевых и канальных сигналов. Характеристика проблемы.79
2.2 Разработка математических основ обработки речевых и канальных сигналов при хранении и передаче речевых данных в ИТС.89
2.3 Разработка алгоритмов отображения пространства отрезков речевых сигналов на дискретное пространство частотных интервалов.103
2.4Вычислительные эксперименты по оценке эффективности разработанных алгоритмов.116
2.4.1 Оценивание точности аппроксимации собственных функций субполосных ядер набором собственных векторов субполосных матриц.116
2.4.2 Оценивание погрешностей вычислений долей энергий отрезка речевого сигнала в заданных частотных интервалах на основе квадратурной формулы прямоугольников.125
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Разработка и исследование методов и алгоритмов субполосного кодирования речевых сообщений при хранении и передаче речевых данных2013 год, кандидат технических наук Болдышев, Алексей Владимирович
Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах2006 год, кандидат технических наук Прохоренко, Екатерина Ивановна
Разработка новых методов и алгоритмов компьютерной обработки данных при сжатии-восстановлении музыкальных файлов в информационно-телекоммуникационных системах2005 год, кандидат технических наук Чижов, Илья Игоревич
Разработка метода обеспечения помехоустойчивости информационных коммуникаций при воздействии сосредоточенных по спектру помех2013 год, кандидат технических наук Старовойт, Иван Александрович
Разработка математических моделей и алгоритмов анализа и синтеза звуковых сигналов в цифровых слуховых аппаратах2009 год, кандидат технических наук Белов, Александр Сергеевич
Введение диссертации (часть автореферата) на тему «Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных»
Актуальность работы. Современный этап развития общества характеризуется увеличением в информационно - телекоммуникационных системах (ИТС) потоков речевых сообщений, как наиболее естественной для человека формы информационного обмена. Для реализации эффективного удаленного взаимодействия на основе речевых сообщений в ИТС используются каналы различной физической природы. В настоящее время наблюдается устойчивая тенденция развития средств индивидуального взаимодействия пользователей, что приводит к росту числа ИТС, в которых для информационного обмена с использованием речевых сообщений применяются технологии беспроводного доступа с использованием канальных сигналов, параметры которых в кодированном виде содержат передаваемую информацию.
Однако возможности роста затрат частотно-временных ресурсов ИТС, под которыми в рамках этой работы понимается ширина частотной полосы и время, доступные для передачи информации в определенной системе, ограничены физическими и техническими факторами, а также объемами финансовых затрат. Это вызывает необходимость поиска путей улучшения использования частотно-временных ресурсов уже существующих каналов связи без существенного изменения их физических и технических характеристик, а также повышение эффективности информационных хранилищ.
Следует отметить, что сегодня решение указанной проблемы, в основном базируется на разработке способов минимизации затрат на хранение и передачу речевых сообщений за счёт уменьшения объёмов их битовых представлений (сжатия) и разработки новых методов передачи информации, основанных на формировании канальных сигналов, энергия которых максимально сосредоточена в заданном диапазоне частот при определенной их длительности
1,6-8,10,34-35,37,39-40,50-57,59,65,67,75,82-83,85,108,112,117-118,121-126,128
130,133,146-150,153-155,158-159,164,178,182-185,191-192,196,198
199,201,205,208-210,235-237,253-2545,256,258-260,266-269,271-272,274].
В области сжатия речевых данных в настоящее время основное внимание исследователей акцентируется на двух основных аспектах [1,6,10,37,39-40,53,56-57,67,110,121-126,128-131,149-150,155,158,164,180,184,187,191-192,198-199,209217-218,223,236-237,255-256,258-259,267-269]:
• обнаружение и кодирование пауз, возникающих между отдельными словами, которые в режиме диалога занимают до 50% его длительности;
• уменьшение объемов битовых представлений речевых сигналов, порождаемых собственно звуками речи.
Используемые сегодня в ИТС методы обнаружения пауз основываются на учете различий спектральных характеристик последовательности, принадлежащей звуку речи от последовательности данных в паузе (шуме) с применением так называемых фильтров линейного предсказания [40,67,128129,27,150,158,164,182-184,196,198,236-237,256].
Однако данный фильтр обладает рядом свойств, которые трудно отнести к достоинствам: наличие в решающей функции «мертвых зон», когда изменение одних параметров компенсируется изменениями других, возможное совпадение максимумов энергетических спектров шума и звука, что приводит к совместному их подавлению и ошибочному отнесению анализируемого участка к паузе, принятие мер по повышению достоверности принятия решения о наличии паузы приводят к необходимости анализа достаточно больших отрезков (до 0,6 с), что не позволяет достигать максимального уменьшения объемов битовых представлений речевых данных за счет обнаружения с последующим кодирование пауз. Это является следствием неадекватности математического аппарата, который лежит в основе алгоритмов обработки исходных речевых данных.
Для уменьшения объемов битовых представлений собственно звуков речи также разработаны различные процедуры обработки. Основой этих процедур служат необратимые преобразования исходных данных либо за счет более грубого квантования по уровню, либо путем построения моделей генерации, позволяющих осуществить их воспроизведение (вокодеры) [6,10,40,53,56,86,121-126,149,158,164,182-185,191-192,196,198-199,209,236-237,256,259,267-269]. Наибольшей степени сжатия удается достичь в случае применения вокодеров. Однако, при этом, наряду с разборчивостью воспроизводимой речи существенно искажается тембр и другие характеристики, что часто бывает неприемлемым, особенно при высоких требованиях к качеству воспроизведения исходных речевых сообщений.
Существующие методы уменьшения объемов битовых представлений собственно звуков речи с использованием грубого квантования по уровню основываются на психоакустической модели, что приводит к необходимости применения так называемых субполосных преобразований отрезков (векторов) отсчетов речевых сигналов [2-6,56-57,85,121-123,125-126,185,199]. В настоящее время для субполосного преобразования принято использовать процедуру прореживания выходных последовательностей КИХ - фильтров (фильтров с конечной импульсной характеристикой), настроенных на соответствующие участки оси частот [6,37,41,69-71,78,116,121-123,140,166,185,194-195,198199,232]. После квантования этих данных по уровню они могут либо сохраняться, либо подвергаться арифметическому кодированию для достижения большей степени сжатия. Восстановление исходных данных для воспроизведения речи принято осуществлять с использованием специально рассчитанных КИХ - фильтров. Такая процедура субполосного преобразования не является оптимальной в смысле минимума погрешностей аппроксимации спектров исходных векторов в выбранных частотных диапазонах, что приводит к увеличению погрешностей восстановления данных по квантованным значениям и, как следствие, к ухудшению качества воспроизводимой речи.
Таким образом, существует реальная необходимость осуществить разработку эффективных методов и алгоритмов сжатия речевых данных для минимизации затрат частотно-временных ресурсов ИТС при их хранении и передачи.
При передаче сжатых речевых данных минимизация затрат частотно-временных ресурсов ИТС сегодня в основном решается на основе применения методов, которые базируются на принципах формирования канальных сигналов с различными видами манипуляции, позволяющими в определенной степени сузить занимаемую полосу частот или повысить помехоустойчивость их приема [34-35,50-52,54-55,59,65,75,82-83,108,112,133,146,147-148,153
154,159,178,104,253-254,260,266,271,272,232]. Например, в системах мобильной связи GSM передача речевых сообщений осуществляется посредством применения канальных сигналов с GMSK манипуляцией (Gaussian Minimum Shift Keying) [50,59,75,108,112,148,235,272]. Эта гауссовская двухпозиционная частотная манипуляция с минимальным сдвигом обладает двумя особенностями, одна из которых - "минимальный сдвиг", другая - гауссовский вид огибающей модулирующего символа. Обе особенности направлены на сужение полосы частот, занимаемой GMSK-сигналом в канале радиосвязи. Однако эти модификации приводят к тому, что помехоустойчивость у таких сигналов не велика.
Методы передачи, обладающие высокой помехоустойчивостью (BPSK-двоичная фазовая манипуляция) как правило, занимают довольно широкую частотную полосу, что приводит к нерациональному использованию выделенных частотных ресурсов канала связи и, как следствие, к возникновению специфических видов помех, которые принято называть интерференционными [48,54,59,146,148,107,118,120,181,200,213,222,233]. Для уменьшения влияния этого типа помех на достоверность принимаемой информации приходится вводить защитные частотные или временные интервалы между соседними каналами связи, что также снижает эффективность использования имеющихся частотно-временных ресурсов ИТС.
Вместе с тем, применение новой разработки - технологии ортогонального частотного уплотнения (OFDM), в последнем поколении систем беспроводного широкополосного доступа (WiMAX), позволило обеспечить достаточно низкий уровень интерференционных помех и тем самым уменьшить защитные частотные интервалы (полосы) между соседними каналами [35,50-52, 75,108,112,210, 235,253-254,260,266,271,272,274,281]. Однако минимизировать уровень этого вида помех при использовании указанной технологии для передачи информации не представляется возможным из-за применения в качестве канальных сигнальных конструкций ортогональных базисов с прямоугольной формой модулирующего импульса.
Все рассмотренные выше классические методы узкополосной модуляции разработаны с целью достижения максимальной спектральной эффективности, т. е. передачи информации с возможно большей скоростью в возможно более узкой полосе частот [59]. Проблема заключается в том, что с увеличением числа пользователей количество каналов, выделенных для связи, должно возрастать. В то же время, как было указано выше, общий частотный ресурс ИТС является ограниченной величиной, и, более того, невозможно бесконечно уменьшать полосу частот, в которой осуществляется передача информации [59]. В системах связи с простыми сигналами эффективность использования выделенного частотного ресурса дополнительно снижается за счет того, что при большой неопределенности частоты, вызванной эффектом Допплера, и изменениях времени прихода принимаемых сигналов для снижения взаимных помех приходится вводить защитные интервалы по частоте [55].
Одним из методов, позволяющим кардинально увеличить число пользователей при ограниченном частотном ресурсе ИТС, является использование модулированных сигналов с расширенным спектром, иначе называемых сигналами с шумоподобным спектром или широкополосными шумоподобными канальными сигналами (ШШКС) [55,59,64,82,181,200,233,4244,109,177,215,219,233,238]. Основная идея применения сигналов с расширенным . спектром заключается в том, чтобы вместо узкополосного модулированного сигнала, осуществляющего передачу информации в выделенном ограниченном участке спектра, использовать сигнал с расширенным спектром, занимающим весь выделенный для системы связи участок спектра [59]. Но при этом значительное количество пользователей могут одновременно использовать выделенную полосу частот. Для разделения пользователей, работающих одновременно в одной и той же полосе частот, применяется расширение спектра цифрового модулирующего сигнала (а значит, и высокочастотного сигнала) с помощью специальной кодовой последовательности. Каждому пользователю назначается персональная кодовая последовательность для расширения спектра, которая и позволяет абонентам выделять из совокупности принимаемых реализаций ШШКС только предназначенный им сигнал. Поскольку общее количество кодов может быть очень велико, то и количество пользователей в выделенной полосе частот может быть значительно больше, чем при разбиении выделенной полосы частот на отдельные подканалы [59,200].
В настоящее время при построении современных ИТС широко применяются ШШКС сформированные посредством модуляции по фазе гармонического несущего колебания по закону изменения псевдослучайной кодирующей последовательности (ФМ ПСП) [42-44,55,109,119,177,200,215,233, 238], которые хотя и реализуют в определенной степени все указанные преимущества сложных сигналов, однако при их использовании, особенно при передаче информации в системах мобильной или спутниковой связи возникает необходимость устранения неопределенности по частоте, что приводит к дополнительному увеличению времени поиска и синхронизации, а также к значительному усложнению аппаратуры их обработки.
Таким образом, возникает необходимость разработки эффективных методов и алгоритмов формирования и обработки канальных сигналов для передачи сжатых речевых данных с минимизацией частотно-временных затрат ИТС.
Из сказанного становится очевидным, что необходимость учета различных аспектов хранения и передачи речевых данных, включая принципы построения технических средств передачи информации по каналам связи различной природы и множественность критериев оценки качества звучания речевых сообщений, придает проблеме минимизации затрат частотно-временных ресурсов ИТС, системный характер, а ее решение отвечает требованию оптимизации этого важного класса технических систем.
Целью работы является повышение эффективности использования ИТС при хранении и передаче речевых данных на основе разработки минимизирующих затраты их частотно-временных ресурсов вариационных методов субполосной обработки речевых и канальных сигналов.
Для достижения поставленной цели были сформулированы и решены следующие основные задачи.
1. Разработка и исследование оптимальных методов и алгоритмов обработки речевых сигналов на основе субполосных представлений в задачах сжатия речевых данных.
1.1. Разработка и исследование математических основ оптимального субполосного анализа речевых сигналов.
1.2. Разработка и исследование методов обнаружения и кодирования речевых данных, принадлежащих паузам, между звуками слитно произнесенной русской речи, на основе учета различий в распределениях долей энергий по частотным интервалам выходных сигналов микрофона при речевых воздействиях и в паузах между ними.
1.3. Разработка и исследование методов уменьшения объемов битовых представлений данных об отрезках речевых сигналов, порождаемых звуками русской речи на основе квантования по уровню коэффициентов разложения по собственным векторам субполосных матриц из т-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.
2. Разработка и исследование методов формирования и приема канальных сигналов, минимизирующих затраты частотно-временных ресурсов ИТС при передаче речевых данных.
2.1. Разработка и исследование методов и алгоритмов оптимального анализа и синтеза канальных сигналов для систем передачи речевой информации в режиме разделения частотно-временного ресурса ИТС.
2.2. Разработка методов и алгоритмов формирования и приема широкополосных шумоподобных канальных сигналов (ШШКС), минимизирующих затраты частотно-временных ресурсов ИТС при большой неопределенности частоты, вызванной эффектом Доплера, и изменениях времени прихода принимаемых сигналов.
3. Разработка технических решений, позволяющих реализовать на основе применения элементов цифровой вычислительной техники созданные алгоритмы обработки речевых и канальных сигналов, минимизирующие затраты частотно-временных ресурсов ИТС при хранении и передаче речевых данных.
Методы и средства исследований. При решении указанных задач использовались методы теории преобразования Фурье, оптимизации, линейной алгебры и теории матриц, теории информации, теории вероятностей и математической статистики, теории сигналов, включая цифровые методы их формирования и обработки, вычислительный эксперимент.
Степень достоверности результатов проведенных исследований обеспечивается корректностью проведенных математических преобразований, непротиворечивостью сформированных положений и выводов исследования установленным ранее фактам теории и практики построения ИТС и повышения их эффективности при реализации речевого информационного обмена, а также подтверждается многочисленными вычислительными экспериментами с речевыми и канальными сигналами.
Научную новизну составляют следующие результаты. Теоретические основы минимизации затрат частотно-временных ресурсов ИТС при хранении и передаче речевых данных, созданные на основе математического аппарата собственных функций субполосных ядер, включая:
• метод обработки речевых данных на основе обнаружения и кодирования пауз между звуками слитно произносимой речи с применением решающей функции, обладающей максимальной чувствительностью к наличию в отдельных частотных интервалах энергии, обусловленной звуками речи, что позволяет достичь максимальных степеней сжатия данных при сохранении высокого качества воспроизведения речевых сообщений;
• метод сжатия речевых данных на основе обнаружения и кодирования пауз в условиях изменяющихся фоновых шумов путем отображения пространства отрезков речевых сигналов на дискретное пространство заданных частотных интервалов;
• метод сжатия речевых данных с исключенными паузами на основе квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из т-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей;
• интерполяционный метод формирования канальных сигналов с максимальной концентрацией энергии в изменяющейся частотной полосе ограниченных размеров и точным восстановлением передаваемых данных при отсутствии помех;
• вариационный метод формирования канальных сигналов для систем цифровой передачи информации с частотным уплотнением, обеспечивающий при разделении каналов на основе оптимальной линейной субполосной частотной фильтрации максимальную концентрацию энергии в заданной частотной полосе и точным восстановлением передаваемых данных при отсутствии помех;
• метод восстановления канальных сигналов для систем цифровой передачи с частотным уплотнением на основе оптимальной линейной субполосной частотной фильтрации, позволяющий в отличие от используемой для этих целей КИХ-фильтрации исключить влияние смежных каналов передачи;
• методы формирования и обработки ТТТТТТКС для систем цифровой передачи с кодовым разделением адресов, обладающих по сравнению с существующими аналогичными классами канальных сигналов значительно большим объемом слабокоррелированных форм и свойством инвариантности к допплеровскому рассогласованию по частоте, что позволяет минимизировать затраты частотно-временных ресурсов ИТС при связи между подвижными объектами за счет эффективного использования выделенной частотной полосы и обеспечения одновременного информационного обмена для большего количества абонентов.
Практическая значимость результатов исследований определяется возможностью повышения эффективности ИТС при хранении и передаче речевых данных на основе минимизации затрат их частотно-временных ресурсов с помощью разработанных методов и алгоритмов обработки речевых и канальных сигналов с применением предлагаемых технических решений.
Реализация результатов исследования осуществлена: в Белгородском филиале ОАО «РосТелеком», в ОАО «Концерн Созвездие», в НИИ «СпецРадио», в учебном процессе факультета компьютерных наук и телекоммуникаций НИУ «БелГУ» при подготовке специалистов по направлению инфокоммуникационные технологии и системы связи. Внедрения подтверждаются соответствующими документами.
Связь с научными и инновационными программами.
Результаты диссертационных исследований были использованы при выполнении ряда проектов в рамках следующих программ фундаментальных, поисковых и инновационных исследований:
• аналитической ведомственной целевой программы федерального агентства по образованию РФ «Развитие научного потенциала высшей школы в 2006 - 2008 гг.», проект РНП 2.1.2.4974;
• федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России, 2007 - 2012 гг.», поисковые исследования в рамках Госконтракта от 26 февраля 2007 года № 02514114010;
• аналитической ведомственной целевой программы федерального агентства по образованию РФ «Развитие научного потенциала высшей школы в 2009 - 2011 гг.», проект 656;
• федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 шды», Государственный контракт № П964 от 27 мая 2010 г.;
• гранта РФФИ, проект №Ю-07-00326-а, 2009 - 2010 гг.;
• федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 годы», Государственный контракт № 14.740.11.0390, 2011-2012 гг.;
• гранта РФФИ, проект № 12-07-00514-а, 2012 - 2014 гг.
Положения, выносимые на защиту.
1 .Теоретические положения, совокупность которых является вкладом в развитие перспективного направления - создание методов обработки речевых и канальных сигналов, повышающих эффективность использования частотно-временных ресурсов ИТС при хранении и передаче речевых данных.
1.1. Аппарат собственных функций субполосных ядер, на основе которого адекватно сформулированы вариационные условия и решены следующие оптимизационные задачи обработки и передачи речевых данных.
• вычислений точных значений долей энергий сигналов в заданных частотных интервалах;
• наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;
• построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;
• формирования и обработки канальных сигналов с максимальной концентрацией энергии в заданной частотной полосе при точном восстановлении передаваемых данных;
• формирования IIШЖС с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.
1.2. Методы сжатия речевых данных на основе оптимального обнаружения и кодирования пауз и квантования по уровню коэффициентов разложения отрезков сигналов, принадлежащих собственно звукам речи, по собственным векторам субполосных матриц из ^-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.
1.3. Методы формирования и обработки канальных сигналов, оптимальных в смысле минимизации требующейся для передачи ширины частотной полосы с точным восстановлением передаваемых данных при отсутствии помех.
1.4. Методы формирования ШШКС для передачи речевых данных с кодовым разделением ресурсов ИТС, позволяющие минимизировать время на их обнаружение и синхронизацию на приемной стороне и выделяемую частотную полосу для каждого абонента при реализации связи между подвижными объектами.
2. Алгоритмы, реализующие разработанные методы обработки речевых и канальных сигналов при хранении и передаче речевых данных.
3. Результаты вычислительных экспериментов по исследованию разработанных алгоритмов обработки речевых и канальных сигналов, иллюстрирующие их преимущества при хранении и передаче речевых данных по сравнению с используемыми в настоящее время.
4.Технические решения, позволяющие реализовать созданные алгоритмы обработки речевых и канальных сигналов на основе средств цифровой вычислительной техники.
Специальность, которой соответствует диссертация. Содержание диссертации соответствует паспорту специальности 05.13.01 -системный анализ, управление и обработка информации (технические науки) по следующим областям исследования. п.1. Теоретические основы и методы системного анализа, оптимизации, управления, принятия решения и обработки информации. п.4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решения и обработки информации. п.12. Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации.
Апробация результатов диссертационных исследований. Результаты диссертационных исследований обсуждались на 18 научно-технических конференциях: 6-й Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций (г. Уфа, 2005 г.); 5-й и 6-й Международных научно-технических конференциях «Проблемы информатики и моделирования» (г. Харьков, Украина, 2005, 2006 гг.); 8-й, 10-й и 13-й Международных конференциях и выставках «Цифровая обработка сигналов и ее применение» (г. Москва, 2006, 2008, 2011 гг.); на международном научно-техническом семинаре «Системы синхронизации, формирования и обработки сигналов для связи и вещания» (г. Белгород, 2006 г.; г. Воронеж, 2009 г.; г. Нижний Новгород, 2010 г.; г. Одесса, Украина, 2011 г.); 13-й Международной научно-технической конференции «Радиолокация, навигация, связь» (г. Воронеж, 2007 г.); Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г. Винница, Украина, 2010 г.); 10-й и 11-й Международных научно-практических конференциях «Исследование, разработка и применение высоких технологий в промышленности» (г. Санкт-Петербург, 2010, 2011 гг.); 2-й Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г.Харьков, Украина, 2011г.); XII Международной научно-практической конференции «Кибернетика и высокие технологии XXI века» (г. Воронеж, 2011 г.); 2-й Международной научно-технической конференции «Компьютерные науки и технологии» (г. Белгород, 2011 г.).
По результатам исследований опубликована 81 работа, из них 30 работ в изданиях из списка ВАК РФ, 2 монографии, получено 12 авторских свидетельств, 4 патента РФ и 18 свидетельств Роспатента РФ о государственной регистрации программ для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и приложений, в которых приведены ряд результатов экспериментальных исследований, блок-схемы разработанных алгоритмов и документы, подтверждающие новизну результатов, полученных в работе.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Метод обеспечения помехоустойчивости информационных коммуникаций при субполосной передаче информации2012 год, кандидат технических наук Урсол, Денис Владимирович
Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов2013 год, кандидат технических наук Фирсова, Александра Александровна
Сжатие речевых данных на основе субполосного анализа и синтеза речевых сигналов в области определения их косинус-преобразования2021 год, кандидат наук Трубицына Диана Игоревна
Разработка методов и алгоритмов субполосного моделирования эмпирических данных2011 год, кандидат физико-математических наук Туяков, Самат Валерьевич
Методы и цифровые устройства адаптивной многоскоростной обработки сигналов в задачах обратного моделирования динамических систем2005 год, кандидат технических наук Линович, Александр Юрьевич
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Белов, Сергей Павлович
ЗАКЛЮЧЕНИЕ
1. Разработаны оптимальные методы и алгоритмы обработки речевых и канальных сигналов, позволяющие повысить эффективность ИТС при передаче и хранении речевых данных на основе минимизации затрат их частотно - временных ресурсов.
1.1.Созданы теоретические положения оптимального частотного анализа речевых и синтеза канальных сигналов на основе математического аппарата собственных функций субполосных ядер, позволившие адекватно сформулировать вариационные условия и получить решения следующих оптимизационных задач:
•вычисления точных значений частей энергий отрезков сигналов в заданных частотных интервалах;
•наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;
•построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;
•формирования и обработки канальных сигналов с максимальной концентрацией энергии в заданной частотной полосе при точном восстановлении передаваемых данных;
•формирования ШШКС с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.
1.2. Разработаны методы и алгоритмы эффективного сжатия речевых данных на основе оптимального обнаружения и кодирования пауз в речевых сообщениях и оптимального квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из совокупности т-информационных частотных интервалов, которые определяют наилучшую, в смысле минимума евклидовой нормы погрешности, аппроксимацию соответствующих отрезков трансформант Фурье.
1.3. Созданы методы и алгоритмы формирования оптимальных канальных сигналов для передачи речевых данных по каналам связи, обладающих максимальной концентрацией энергии в ограниченной частотной полосе при точном восстановлении исходных данных в условиях отсутствия помех.
1.4. Разработаны методы формирования ТТТТТТКС для передачи речевых данных с кодовым разделением ресурсов ИТС, позволяющие минимизировать время на их обнаружение и синхронизацию на приемной стороне и выделяемую частотную полосу для каждого абонента при реализации связи между подвижными объектами.
2. Разработаны предложения по технической реализации созданных алгоритмов обработки речевых и канальных сигналов на основе средств цифровой вычислительной техники.
3. Получены оценки частотных концентраций энергий отрезков речевых сигналов для всех звуков русской речи как отношений минимальных суммарных размеров совокупности частотных интервалов, где сосредоточена заданная доля энергии т. к ширине всей частотной полосы и введено понятие ^-информационных частотных интервалов.
4. Показано, что оптимальная линейная субполосная частотная фильтрация на основе наилучшей в смысле минимума евклидовой нормы погрешности аппроксимации в заданном частотном интервале отрезка трансформанты Фурье исходного сигнала позволяет получить сигнал, который не зависит от энергии в смежных частотных интервалах, что доказывает целесообразность её применения при разделении канальных сигналов при передаче информации в режиме частотного уплотнения.
5. Установлены основные свойства вероятностей ошибок первого и второго родов при обнаружении пауз в речевых сигналах с помощью разработанной решающей функции максимальной чувствительности, что позволило создать алгоритм обучения по реальным данным с целью установления границ критической области.
6. На основе разработанного аппарата субполосного анализа проведены детальные исследования влияния дискретизации на точность вычислений основных субполосных характеристик речевых сигналов, что позволило установить нижнюю границу для частоты дискретизации.
7.Созданы кодовые книги квазиоптимальных квантователей коэффициентов разложений отрезков речевых сигналов, соответствующих разным звукам русской речи, по собственным векторам субполосных матриц совокупности ш-информационных частотных интервалов.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.