Модели и алгоритмы в системах анализа речевых сигналов тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Трубицын, Владимир Геннадьевич

  • Трубицын, Владимир Геннадьевич
  • кандидат технических науккандидат технических наук
  • 2013, Орел
  • Специальность ВАК РФ05.13.17
  • Количество страниц 134
Трубицын, Владимир Геннадьевич. Модели и алгоритмы в системах анализа речевых сигналов: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Орел. 2013. 134 с.

Оглавление диссертации кандидат технических наук Трубицын, Владимир Геннадьевич

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1. Анализ процесса речеобразования, характеристик, свойств и моделей речевого сигнала

1.1 Процесс речеобразования. Характеристики и свойства речевых сигналов

1.2 Существующие методы и алгоритмы сегментации речевых сигналов

для его представления и обработки

1.3 Анализ существующих методов преобразования устной речи в речевые данные (кодирование речевого источника)

1.4 Постановка задачи исследования

Выводы по главе

2. Математическая модель анализа речевых данных в системах представления устной речи

2.1 Выделение участков квазистационарности для обработки речи на основе корреляционного анализа реализаций речевого сигнала

2.2 Математическая модель анализа речевых данных в системах

представления устной речи

Выводы по главе

3. Методика формирования участков речевых отсчётов, порождаемых вокализованными звуками

3.1 Способы и приёмы определения значений интервалов автокорреляции временного ряда интервалов автокорреляции, соответствующие структурным изменениям в речевом сигнале

3.2 Линейная регрессионная модель тренда временного ряда интервалов автокорреляции смежных сегментов финитного участка речевых отсчётов

3.3 Оценка временного ряда интервалов автокорреляции смежных

сегментов финитного участка речевых отсчётов

Выводы по главе

4. Алгоритм передискретизации речевых отсчётов за счёт изменения частоты выборки речевых отсчётов на выделяемых

участках

4.1. Уменьшение количества речевых отсчётов в формируемых участках квазистационарности для анализа и представления речи

4.2 Алгоритм передискретизации речевых отсчётов за счёт изменения частоты выборки речевых отсчётов на выделяемых участках

4.3 Анализ корректности алгоритма передискретизации речевых отсчётов за счёт изменения частоты выборки на выделяемых участках

4.4 Требования и ограничения применения процедур многоскоростной обработки при передискретизации речевых отсчётов

4.5 Результаты экспериментальных исследований алгоритма

передискретизации речевых отсчётов за счёт изменения частоты

выборки на выделяемых участках

Выводы по главе

5. Оценка эффективности методики формирования участков

речевых отсчётов, порождаемых вокализованными звуками и

алгоритма передискретизации речевых отсчётов на выделяемых

участках

5.1 Интервальные оценки использования методики по формированию участков квазистационарности вокализованных звуков и потерь

мощности речевых сигналов при передискретизации

Выводы по главе

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

Приложение А

Приложение В

Приложение С

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Модели и алгоритмы в системах анализа речевых сигналов»

ВВЕДЕНИЕ

Актуальность работы: В настоящее время наблюдается значительный рост исследований и разработок в области анализа, кодирования и синтеза речи. Одной из основных задач, стоящих перед речевыми технологиями является задача компактного цифрового представления устной речи для её хранения, обработки, передачи и защиты.

Интерес к системам анализа речевых данных при кодировании обусловлен повышением требований к качеству речевого сигнала в системах различного назначения:

1. В криптографических системах государственного, военного и корпоративного назначения.

2. В авиационных системах связи для реализации возможности определения психофизиологического состояния летчика по голосу.

3. В системах защиты информации по каналам диапазонов сверх длинных и длинных волн при организации связи типа "электронной речевой почты".

4. В системах хранения речи для автоматизированных, электронных, речевых справочных служб.

5. В мультимедиа ориентированных системах коммуникации.

6. В системах речевого управления.

Существующие модели речеобразования не в полной мере соответствуют их адекватному представлению в речевых данных, что ограничивает применение речевых технологий. Это связанно с возникающим противоречием: с одной стороны длительность временного участка речевых отсчётов для анализа должна быть малой, чтобы последовательность таких участков точно отражала динамику изменений в речевом сигнале, в частности появление коротких пауз и участков переходных звуков. С другой стороны длительность анализируемого участка должна быть достаточно большой, чтобы обеспечить точность оценки характеристик речевого сигнала.

Данное противоречие приводит к проблемам человеко-машинного взаимодействия и искусственного интеллекта возникающим при автоматиче-

ском распознавании и понимании речи, синтезе и воспроизведении речи из данных, записи и хранении больших объёмов речевых данных отражающих человеческие знания в различных областях, верификации и идентификация диктора.

Разрешение противоречия возможно за счёт принятия соотношения локально-стационарного характера модели речеобразования с квазистационарным характером участков речевого сигнала, соответствующих режиму установившихся звуков.

Стратегия определения роли анализа субъективных факторов в деле создания речевых интерактивных систем имеет три аспекта:

1. Разработка методов для определения областей применения технологии автоматического распознавания, кодирования и генерации речи.

2. Выбор подходящих алгоритмов распознавания, кодирования, генерации речи и характеристик соответствующих систем.

3. Включение речевых подсистем в контекст задач пользователя.

Исходя из анализа литературы и изделий, представленных на тематическом рынке программного обеспечения или компьютерного оборудования, следует, что ни одна из подобных систем не лишена принципиальных недостатков. Иными словами, необходимого уровня эффективного представления речевых данных с точки зрения занимаемого объёма и качества воспроизведения существующим изделиям пока достичь не удалось. Такое положение вещей, по-видимому, связано не с частными недостатками конкретных систем, а с необходимостью изменения представлений о закономерностях речевого процесса.

В основе настоящего исследования лежат результаты работ в области: теории и методов параметрического кодирования речи (Д. Фланаган, Г. Фант, М.А. Сапожков, A.A. Пирогов); теории кодирования на основе линейного предсказания ( J1.P. Рабинера, Р.В. Шафера, Дж.Д. Маркела, Б.С. Атола, Д. Раймда, Ф. Итакура, М.Р. Шредера), методов сегментации речевого сигнала (П.Мермелынтайн, Дж. Ван Хемерт, Б. Пеллом, В.Н. Сорокин,

Е.Г. Жиляков). Развитие и использование цифровых процессоров обработки сигналов и труды таких ученых как Б.С. Атол, Д. Серено, Л. Селарио, А. Гершо, Е. Пайксоу, Д.Г. Рове, Т. Ванг привели к усложнению алгоритмов, появлению новых моделей, развитию методов анализа речевых сигналов через синтез.

В указанных трудах имеются фундаментальные научные результаты для дальнейшего развития речевых технологий. Между тем, до настоящего времени существующие подходы к решению задач исследования моделей и алгоритмов для анализа речевых данных и обнаружение закономерностей в них, а так же разработка и исследование методов и алгоритмов представления устной речи носят локальный по областям применений и разрозненный по методам характер. Это делает актуальной тему диссертационных исследований и обуславливает выбор объекта, предмета и цели исследования.

Объект исследования: Процесс анализа речевых сигналов для систем представления данных устной речи.

Предмет исследования: Алгоритмы, модели, методы анализа речевых сигналов для систем представления данных устной речи.

Целью работы является Совершенствование методов анализа устной речи за счёт установления закономерностей в речевых сигналах, при сегментации вокализованных и невокализованных участков для эффективного представления речевых данных.

Для достижения цели были сформулированы и решены частные задачи:

1. Анализ статистических, временных, спектральных, корреляционных характеристик и параметров речевых сигналов фонетических групп звуков русской речи.

2. Исследование существующих методов, моделей и алгоритмов цифрового преобразования речи в системах кодирования речевых сигналов.

3. Разработка методов и алгоритмов формирования участков квазистационарности в реализациях речевого сигнала, соответствующих вокализованным звукам.

4. Разработка метода уменьшения объёма речевых данных за счёт изменения частоты выборки речевых отсчётов в сформированных границах участков квазистационарности речевого сигнала.

5. Оценка эффективности предложенных методов в системах анализа речевых сигналов для представления устной речи.

Методы исследований базируются на использовании математического аппарата теории вероятности и математической статистики, теории корреляционного и спектрального анализа, цифровой обработки сигналов, методов регрессионного анализа и методов моделирования систем, а так же исследование речевых процессов с использованием средств и методов имитационного моделирования.

Научная новизна:

1. Математическая модель анализа речевых сигналов, базирующаяся на методе корреляционного анализа, позволяющая представлять речевые данные в виде временных рядов интервалов автокорреляции смежных сегментов речевых отсчётов фиксированной длины.

2. Методика формирования участков речевых отсчётов, порождаемых вокализованными звуками, по принятым решениям на основе аппроксимации временных рядов интервалов автокорреляции смежных сегментов речевых отсчётов линейными моделями тренда, позволяющая определять границы таких участков для эффективного представления речевых отсчётов в данных.

3. Алгоритм передискретизации за счёт изменения частоты выборки речевых отсчётов на выделяемых участках с помощью разработанной методики, позволяющий сформировать необходимое и достаточное количество речевых отсчётов для их эффективного представления в речевых данных.

Практическая значимость подтверяедается: разработанными теоретическими положениями, доведенными до патентов на изобретения. 1. Патент на изобретение № 2248619 от 20.03.2005 г "Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов".

2. Патент на изобретение № 2400831 от 21.09.2010 "Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием".

3. Патент на изобретение № 2432624 от 11.05.2011 "Способ уменьшения объема данных при широкополосном кодировании речевого сигнала".

4. Патент на изобретение № 2445718 от 20.03.2012 "Способ выделения сегмента обработки речи на основе анализа корреляционных зависимостей в речевом сигнале".

Реализация результатов исследования осуществлена: в ФГБОУ ВПО «Госуниверситет - УНПК» г. Орёл на кафедре «Электроника, вычислительная техника и информационная безопасность» в рамках учебно-методических комплексов дисциплин «Основы цифровой обработки сигналов» и «Проектирование центральных и периферийных устройств ЭВС» для специальностей 210201 «Проектирование и технология радиоэлектронных средств» и 210202 «Проектирование и технология электронно-вычислительных средств» а также планируется для использования в рамках дисциплины «Теория кодирования, сжатия и восстановления информации» для направления подготовки 090900 «Информационная безопасность».

Внедрения подтверждаются соответствующими документами.

Область исследования. Содержание диссертации соответствует паспорту специальности 05.13.17 "Теоретические основы информатики" (технические науки) по следующим областям исследований:

п.5. "Разработка и исследование моделей и алгоритмов анализа данных, обнаружение закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображе-

55

НИИ ,

п.6. "Разработка методов, языков и моделей человеко-машинного общения; разработка методов и моделей распознавания, понимания и синтеза речи, принципов и методов извлечения данных из текстов на естественном языке".

Положения, выносимые на защиту:

1. Математическая модель анализа речевых данных в системах представления устной речи, базирующаяся на методе корреляционного анализа.

2. Методика формирования участков речевых отсчётов, порождаемых вокализованными звуками, базирующаяся на оценке соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единой линейной регрессионной модели тренда временного ряда к кусочно-линейной регрессионной модели.

3. Алгоритм передискретизации речевых отсчётов за счёт изменения частоты выборки речевых отсчётов на выделяемых участках с помощью разработанной методики, базирующийся на использовании процедур децимации и интерполяции.

Достоверность выводов и рекомендаций обусловлена корректностью применяемых преобразований с использованием теории вероятности и математической статистики, непротиворечивостью и воспроизводимостью результатов, полученных теоретическим путем и в ходе выполнения экспериментов, проведением оценки адекватности разработанных моделей и устойчивости алгоритмов.

Апробация результатов диссертационного исследования.

Результаты диссертационного исследования обсуждались на следующих научно-технических конференциях: IX Международная научная конференция. Сборник трудов. - М.: Академия управления МВД России, 2000. - С. 372 -377; 5-я международная конференция "Цифровая обработка сигналов и ее применение". Доклады. Том 2. - М: Радиотехника, 2003. - С. 405 - 407; Proceedings of International Workshop "Speech and computer" SPECOM'2003. -M.: MSLU, 2003. - P. 168- 169;

Публикации. По теме диссертационного исследования опубликовано 14 печатных работ (из них 7 в журналах из списка ВАК РФ), в том числе четыре патента на изобретение зарегистрированных в Государственном реестре изобретений Российской Федерации.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Трубицын, Владимир Геннадьевич

Выводы по главе 5

1. В исследовании подтверждено, что повышение эффективности систем представления речевых данных на активных участках зависит от частоты появления вокализованных звуков и их местоположения в словах, а так же от слогового состава русской речи. В работе учитывается, что вокализованные звуки составляют 68 % общего числа звуков.

2. В качестве показателя эффективности разработанной методики формирования участков речевых отсчётов предложена разность между границами речевых отсчётов формируемыми оператором и системой, реализующей процедуры методики.

3. Экспериментальные исследования показали, что величина разности распределена по нормальному закону распределения для гласных а, о, у, ы, э, и, при их расположении в начале, середине и конце слова и взаимодействии с различными классами согласных. Результаты интервальной оценки математического ожидания разности доверительной вероятностью у = 0,95.

4. В качестве показателя эффективности алгоритма передискретизации в работе использовался коэффициент уменьшения речевых отсчетов, который определяется отношением числа речевых отсчётов с равномерной дискретизацией к количеству отсчётов полученных с использованием децимации.

5. При оценке эффективности передискретизации в работе учитывались требования к качеству восстанавливаемой речи. Объективным показателем качества в работе принят квадрат разности между отсчётами речевого сигнала до и после обработки в пределах активного речевого участка, выраженный в процентном отношении к мощности исходной реализации.

6. Проведенные экспериментальные исследования алгоритма передискретизации, показали, что величина потерь при восстановлении участков, для которых была реализована процедура децимации, распределена по закону близкому к нормальному. Для оценки математического ожидания потерь использовались интервальные оценки с доверительной вероятностью у = 0,9 для шести основных гласных звуков: а, о, у, ы, э, и, при их расположении в начале, середине и конце слов во взаимодействии со звонкими и глухими согласными.

ЗАКЛЮЧЕНИЕ

1. В исследовании решена новая научная задача обнаружения существенных изменений в речевом сигнале и сегментировании речевых отсчётов во временной области, имеющая существенное значение для области разработки моделей и алгоритмов при анализе речевых отсчётов устной речи.

2. В результате анализа существующих методов представления и рекомендаций известных исследователей речи доказано, что повышение эффективности методов и алгоритмов преобразования речи может быть достигнуто за счет учета корреляционных свойств речевого сигнала в рамках локально-стационарной модели речеобразования. Это позволяет представить задачу эффективного представления, как задачу формирования необходимого объёма речевых данных на участках переменной длины, соответствующих вокализованным звукам.

3. Определено, что автокорреляционные функции для сегментов речевых отсчётов из совокупности смежных на финитном участке речевого сигнала соответствуют состояниям вокализованного, переходного с вокализованного, переходного к невокализованному и от невокализованного звука. Установлено, что динамику изменения речевых отчётов соответствующих состояний можно проследить по изменениям значений временного ряда интервалов автокорреляции для совокупности смежных сегментов финитного участка.

4. Установлено, что для состояний речевого сигнала соотношение значения интервала автокорреляции к интервалу дискретизации имеет существенные различия. Для состояния вокализованного звука это соотношение изменяется от 2 до 9, для невокализованного равно 1, а для финитных участков, классифицируемых как переходные, принимает значения десятков и сотен.

5. Выявлено, что качественная оценка динамики изменений речевых отсчётов имеющая линейное нарастание значений интервалов автокорреляции во временном ряде соответствует переходу реализации речевого сигнала в низкочастотную часть спектра, а уменьшение в высокочастотную область.

6. Установлено, что существенные изменения значений временных рядов, соответствующих финитным участкам речевых отсчётов, соответствуют изменениям в динамике речевого сигнала. Для определения границ участка квазистационарности необходима оценка структурной стабильности временного ряда интервалов автокорреляции.

7. Методика формирования участков речевых отсчётов, порождаемых вокализованными звуками, основана на единовременных изменениях в регрессионной модели тренда временного ряда, вызванных структурными изменениями в процессе речеобразования.

8. Выявлено, что изменение значений интервалов автокорреляции влечет за собой изменение в структуре временного ряда. Для определения структурных изменений временного ряда предложено оценивать снижение остаточной суммы квадратов при переходе от общего уравнения тренда для всей последовательности к кусочно-линейной модели тренда временного ряда. Разделение последовательности на две части приводит к уменьшению числа наблюдений и как следствие - к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели.

9. В результате анализа проведённых экспериментов установлено, что математическое ожидание погрешности положения границ участков квазистационарности для вокализованных гласных изменяется в пределах от 1,67 миллисекунд при их взаимодействии с глухими щелевыми согласными до 2,96 миллисекунд с сонорными согласными. Доверительные интервалы погрешности положения границ составляют 0,6 миллисекунды для глухих щелевых и 1,1 миллисекунды для сонорных.

10.Проведенные эксперименты, с помощью разработанного алгоритма передискретизации речевых отсчётов позволяют утверждать, что определение временных и спектральных границ временного отрезка речевых данных устраняет несоответствие между двумя противоречивыми требованиями к речевому сигналу. С одной стороны сегменты речевого сигнала должны быть короткими, чтобы их последовательность точно отражала динамику изменений речевого сигнала (в частности появление коротких пауз и переходных звуков). С другой стороны отрезки речевого сигнала для обработки должны быть продолжительными, что позволяет на выявленных участках квазистационарности представлять речевой сигнал меньшим объемом данных.

11.Доказано, что при соответствующей частоте дискретизации уменьшение объёма речевых данных может быть реализовано процедурой децимации, посредством адаптивного изменения частоты выборки речевых отсчётов для участков, соответствующих условиям квазистационарности. Адаптивное изменение частоты выборки осуществляется выбором коэффициента децимации в соответствии с рассчитанными соотношениями между интервалом автокорреляции и дискретизации в пределах квазистационарного участка.

12. Выявлено, что ограничением на значение коэффициента децимации/интерполяции при передискретизации на выделяемых участках квазистационарности являются не только учитываемые форманты для вокализованного звука, но и временная задержка формирования реакции фильтра для восстановления при интерполяции. Для систем, в которых общая последовательность речевых отсчётов формируется из совокупностей выделяемых участков временные задержки, возникающие в результате линейных преобразований таких участков должны быть незначительными. Порядок цифрового фильтра, используемого при осуществлении процедур многоскоростной обработки сигналов должен оставаться низким. Установлено, что обеспечение основного требования при использовании процедур многоскоростной обработки достигается при значениях порядка фильтра равного 19 и 29 при обеспечении затухания в полосе задерживания 40 и 60 децибел соответственно.

13. Полученные результаты определения границ участков квазистационарности вокализованных звуков являются развитием существующих методов сегментации за счёт применения нового способа определения существенных изменений в речевом сигнале без применения спектральных преобразований с погрешностями, вызванными усечением базиса Фурье.

14. Анализ результатов применения алгоритма передискретизации речевых отсчётов на формируемых участках квазистационарности вокализованных гласных позволяет утверждать, что только при значениях коэффициентов децимации и интерполяции М(Ь) = 2 обеспечиваются требования по качеству воспроизведения.

15. Повышение эффективности представления речевых отсчётов лежит в области параметрического представления в выделяемых участках квазистационарности переменной длительности.

Список литературы диссертационного исследования кандидат технических наук Трубицын, Владимир Геннадьевич, 2013 год

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Аграновский A.B., Леднов Д.А., Теоритические аспекты алгоритмов обработки и классификации речевых сигналов - М.: Радио и связь, 2004.

2. Айвазян С.А., Мхитарян В. С. Прикладная статистика и основы экономики: Учебник. -М.: ЮНИТИ, 1998.

3. Айфичер Э., Джервис Б. Цифровая обработка сигналов, Москва/Санкт-Петербург/Киев, 2004 г., 989 с.

4. Антонью. А. Цифровые фильтры: анализ и проектирование. Перевод с английского В.А Лексаченко, В.Г. Челпанова. Под редакцией С.А. По-нырко - М.: Радио и связь, 1983

5. Артюшенко В. М., Шелухин О.И., Афонин М.Ю. Цифровое сжатие видеоинформации и звука: Учебное пособие /Под ред. В. М. Артюшенко. - М. Дашков и К, 2003. - 426 с.

6. Банк М. У., Сучилин В. А., Формирование выборки звукового сигнала при спектральном преобразовании // Электросвязь. - 1990. - №1. - С. 28 -30.

7. Баранников Л. Н., Фомин А. И. Цифровые методы передачи речевых сообщений. - М.: Издательство МАИ, 1996. - 36 с.

8. Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: Учеб. пособие для вузов. - М.: Радио и связь, 2003. - 144с.

9. Vaidyanathan P. P. Multirate Systems and Filter Banks / Prentice Hall / Englewood Cliffs. - NY, 1993.

10. Вайдьнатхан П.П. Цифровые фильтры, блоки фильтров и полифазные цепи с многочастотной дискретизацией: Метод. Обзор // ТИИЭР, 1990.-Т.78. - №3. - С. 77- 120.

11. Вентцель Е. С., Овчаров Л. А., теория вероятностей и её инженерные приложения. - М.: Наука 1988 г.

12. Величкин А. И. Передача аналоговых сообщений по цифровым каналам связи. - М.: Радио и связь, 1983. - 240 с.

П.Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов.-Киев: 1987.-262 с.

14. Воеводин В.В., Тыртышников Е.Е. Вычислительные процессы с тепли-цевыми матрицами. - М.: Наука, 1987. - 124с.

15. Wu Y.J., Kawai H., Ni J., Wang R.H. Discriminative training and explicit duration modeling for HMM-based automatic segmentation // Speech Communication, 2005, V. 47, N. 4, P. 397 - 410.

16. Гмурман В. E. Теория вероятностей и математическая статистика. Учебное пособие для втузов / - 5-е изд., перераб. и доп. - М., "Высшая школа" 1977 г.

17. Голд. Б., Рейдер. Ч. Цифровая обработка сигналов. С приложением работы Д. Кайзера "Цифровые фильтры" - М.: Советское радио, 1973.

18. Голд. Б. Цифровые методы передачи речи. ТИИЭР, 1977, т. 65, № 12.

19. Гольдштейн B.C., Пинчук А.В., Суховицкий A.JI. IP - Телефония. - M.: Радио и связь, 2001. - 336с.: ил.

20. Гольденберг JI.M., Матюшкин Б.Д., Поляк М.Н. Цифровая обработка сигналов. - М.: Радио и связь, 1985. - 312 е.: ил.

21. Гольденберг J1.M., Левчук Ю.П., Поляк М.Н. Цифровые фильтры. - М.: Связь, 1974.-312 е.: ил.

22. Грабовая В.А., Федоров Е.Е., Шелепов В.Ю. О системе компьютерного распознавания русской речи с автоматическим построением эталонов // Искусственный интеллект. - 2000. - №1. - С. 76-81.

23. Денисенко А.Н. Сигналы. Теоретическая радиотехника. Справочное пособие. - М: Горячая линия-Телеком, 2005. - 704 е.: ил.

24. Дремин И.М. Вейвлеты и их использование / И.М. Дремин, О.В. Иванов, В.А. Нечитайло // Успехи физических наук. - 2001. - Т. 171. - №5. -С. 465-500.

25. Елисеева H.H., Курышева С.В., Костеева T.B. Эконометрика: учебник / - 2-е изд. - М: Эконометрика: Учебник / Под ред. И. И.. - М : Финансы и статистика, 2008. - 576 е.: ил.

26. Елисеева И.И., Юзбашев М.М. Общая теория статистики.- 5-е изд., пе-рераб. и доп. - М.: Финансы и статистика, 2004.

27. Ермоленко Т.Н. Алгоритмы сегментации с применением быстрого вейвлет-преобразования / Т.Н. Ермоленко, В.И. Шевчук // Статьи, принятые к публикации на сайте международной конференции Диалог' 2003.

28. Жиляков Е.Г. Методы обработки речевых данных в информационно-телекоммуникационных системах на основе частотных представлений: монография / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко. - Белгород: Изд-во БелГУ, 2007. - 138 с.

29. Жиляков Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным: монография / Е.Г. Жиляков. - Белгород: Изд-во БелГУ, 2007.- 160 с.

30. Жиляков Е.Г. Моделирование речевых сигналов на основе частотных представлений: монография / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко, А.А Черноморец, Н.С. Поболкова. - Белгород: Изд-во ООО "ГиК", 2010.- 157 с.

31. Жиляков Е.Г., Прохоренко Е.И., Болдышев A.B., Фирсова A.A., Фатова М.В. Сегментация речевых сигналов на основе анализа особенностей распределения долей энергии по частотным интервалам // Вестник НТУ "XIII". Тематический выпуск: Информатика и моделирование. -Харьков: НТУ "XIII" - 2011, - №17. - С. 44-50.

32. Зиндер JL Р. Общая фонетика. - М.: Высшая школа, 1979. - 312 с.

33. Златоустова JI. В. Фонетические единицы русской речи. - М.: МГУ, 1981.- 108 с.

34. Златоустова Л. В. Интонация и просодия в организации текста// Звучащий текст. - М.: ИНИОН АН СССР. 1983. - С. 11 - 12.

35. Зюко А.Г., Кловский Д.Д., Коржик В.И., Назаров М.В. Теория электрической связи: Учебник для вузов / Под ред. Д.Д. Кловского. - М.: Радио и связь, 1998.-432 с.

36. Цифровые и аналоговые системы передачи. Под редакцией Иванова В. И,- М.: Радио и связь, 1995. - 232 с.

37. Itakura F., Saito S., Koike Т., Sawabe H., Nishikawa M./ "An audio response unit based on partial autocorrelation," IEEE Trans. Commun., vol. COM-20, pp. 792 - 797, Aug 1972.

38. Itakura F. Line spectrum representation of linear prediction coefficients of speech signals//J. Ac. Soc. Am.- 1975. -V. 57.- № 1.

39. ITU-T Recjmmendation H.323. Packet based multimedia communication systems. - Geneva, 1998.

40. ITU-T Recjmmendation G.711. Pulse Code Modulation of 3kHz Audio Channel. - 1988.

41. ITU-T Recommendation G.723.1. Dual Rate speech coder for multimedia communication transmitting at 5.3 and 6.3 kit / sec. - 1996.

42. ITU-T Recommendation G.728. Coding of Speech at 16 kbit / s Using Low-delay Code Excited Linear Prediction (LD-CELP). - 1992.

43. ITU-T Recommendation G.729. Speech codec for multimedia telecommunications transmitting at 8 / 13 kbit / s. - 1996.

44. Конев А.А., Мещеряков P.B. «Алгоритм сегментации речевого сигнала на вокализованные и невокализованные участки» // Сборник трудов XXII сессии Российского акустического общества. Т. Ill - М.: ГЕОС. -2010.-С. 45-48.

45. Конев А.А., Мещеряков Р.В., Жевуров С.В., Хлебников B.C. Сегментация вокализованных участков речевого сигнала / Сборник трудов XXII сессии Российского акустического общества. Т. Ill - М.: ГЕОС. - 2010. -С. 20-23.

46. Коротаев Г. А. Эффективный алгоритм кодирования речевого сигнала на скорости 4,8 кБит/с и ниже. // Зарубежная радиоэлектроника. - 1996.

- №3. - С. 52-68.

47. Коротаев Г. А. Анализ и синтез речевого сигнала методом линейного предсказания. // Зарубежная радиоэлектроника. - 1990. - №3. — С. 31 — 51.

48. Коротаев Г. А. Некоторые аспекты линейного предсказания при анализе и синтезе речевого сигнала. // Зарубежная радиоэлектроника. - 1991.

- №7.-С. 3-31.

49. Кремер Н.Ш. Теория вероятностей и математическая статистика. Учеб. для вузов / - 3-е изд., перераб. и доп. - М.: ЮНИТИ - ДАНА, 2007 -551с.

50. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ, 2002.

51. Крошьер P.E., Рабинер JI.P. Интерполяция и децимация цифровых сигналов: Метод. Обзор // ТИИЭР. - 1981. - Т.69. - №3. - С. 14-40.

52. Ланнэ A.A., Матюшкин Б.Д, Улахович Д.А. Основы цифровой обработки сигналов: Учеб. Пособие. - Ч.З. - СПБ.: ГУТ, 1998.

53. Ланнэ A.A., Матюшкин Б.Д, Улахович Д.А. Основы цифровой обработки сигналов: Учеб. Пособие. -4.1. - СПБ.: ВАС, 1995.

54. Лившиц М.З., Парфенюк М., Петровский A.A. Широкополосный CELP-кодер с мультиполосным возбуждением и многоуровневым векторным квантованием по кодовой книге с реконфигурируемой структурой// Цифровая обработка сигналов - 2005 -№2. С.20-35.

55. Магнус Я.Р., Катышев П.К., Пересецкий A.A., Эконометрика: Начальный курс: Учебник. - 6-е изд. - М.: Дело, 2004.

56. Макхол. Дж. Линейное предсказание: Обзор // ТИИЭР.-1975,- Т.63.-№4.

57. Мала С. Вейвлеты в обработке сигналов, - М.: Мир, 2005 - 671 с.

58. Machoul. J., "Speech coding find processing", in Modern Signal Processing, T. Kailath, Ed. New York, NY: Hemisphere/Springer-Verlag, 1985, pp. 211

59. Маркел Дж. Д., Грей А. X. Линейное предсказание речи. - М.: Связь, 1980.

60. Матусевич М. И. Современный русский язык. Фонетика. - М.: Просвещение, 1976. - 288 с.

61. Mermelstein P. Automatic segmentation of speech into syllable units // J. Acoust. Soc. Amer., 1975, V. 58, N. 4, P. 880-883.

62. Михаилов В. Г., Златоустова Л.В. Измерение параметров речи / Под редакцией М.А.Сапожкова. -М.Ж Радио и связь, 1987. - 168 е.: ил.

63. Назаров М. В. Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. - М.: Радио и связь, 1985. - 176 с.

64. Оппенгейм А, Шафер Р. Цифровая обработка сигналов. - М.: Связь, 1979.

65. Пилипчук Н. И., Яковлев В. П. Адаптивная импульсно-кодовая модуляция. - М.: Радио и связь, 1986. - 296 с.

66. Погрибной В.А. Дельта-модуляция в цифровой обработке сигналов. -М.: Радио и связь, 1990. - 216 с.

67. Прохоров Ю. Н. Статистические модели и рекуррентное предсказание речевых сигналов. - М.: Радио и связь, 1984. - 240с.

68. Прокис Дж. Цифровая связь.- М.: Радио и связь, 2000. - 800с.

69. Peter Noll. Speech and audio coding for multimédia communications/ Proceedings International Cost 254 workshop on intelligent communication technologies and applications, Neuchatel, Schweiz, In print, 1999.

70. Рабинер Л. P., Шафер P. В. Цифровая обработка речевых сигналов. -М. : Радио исвязь, 1981.- 496с.

71. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. -М.: Мир, 1978.

72. Rabiner L.R., Juang В.-H. Fundamentals of Speech Récognition. Prentice Hall PTR, 1993.-507 p.

73. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. -М.: Радио и связь, 1981. - 224с.

74. Рекомендация G. 726 МСЭ - Т. Адаптивная дифференциальная им-пульсно-кодовая модуляция (АДИКМ) на 40, 32, 24, 16 кБит/с. - МСЭ, 1990.-58с.

75. Рекомендация G. 727 МСЭ - Т. Адаптивная дифференциальная им-пульсно-кодовая модуляция (АДИКМ) с вложенным кодированием с 5, 4, 3, 2 Бит на отсчёт. - МСЭ, 1990. - 58 с.

76. Добавление III к Рекомендации G. 726 МСЭ - Т. Добавление II к Рекомендации G. 727 МСЭ - Т. Сравнение алгоритмов АДИКМ. - МСЭ, 1995.-42 с.

77. Рекомендация G. 727 - Приложение А МСЭ - Т. Расширение рекомендации G. 727 для использования с равномерно-квантованным входом и выходом - МСЭ, 1995. - 6 с.

78. Рекомендация G. 726 - Приложение А МСЭ - Т. Расширение рекомендации G. 726 для использования с равномерно-квантованным входом и выходом - МСЭ, 1995. - 6 с.

79. Сапожков М. А. Речевой сигнал в кибернетике и связи. - М.: Связьиз-дат, 1963. -472 е.: ил.

80. Сапожков М. А. Михайлов В. Г. Вокодерная связь. - М.: Радио и Связь, 1983.-248 е.: ил.

81. Свириденко В.А. Анализ систем со сжатием данных. - М.: Связь, 1977.

- 184с.

82. Сербер Дж. Линейный регрессионный анализ. Перевод с англ. В.П. Носко,-М.: Мир, 1980.

83. Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. - М.: ГЕОС, 1999 - 166 с.

84. Солонина А.И., Улахович Д.А., Арбузов С.М., Соловьёва Е.Б. Основы цифровой обработки сигналов: Курс лекций / Изд. 2-е испр. и перераб.

- СПб.: БХВ-Петербург, 2005. - 768 е.: ил.

85. Сорокин В.Н. Сегментация речи на кардинальные элементы / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. - 2006. - Т. 6. -№ З.-С. 177-207.

86. Сорокин В.Н. Сегментация и распознавание гласных / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. - 2004. - Т. 4. - № 2 - С. 202-220.

87. Трубицын В.Г., Афанасьев А.А. Уменьшение объема данных при широкополосном кодировании речевого сигнала [Текст] // Научно - технический журнал // Цифровая обработка сигналов. - 2011. - № 1 - С. 53 -56.

88. Трубицын В.Г. Патент на изобретение "Способ выделения сегментов обработки речи на основе анализа корреляционных зависимостей в речевом сигнале / Е.И. Новиков // №2445718 Зарегистрировано в Государственном реестре изобретений Российской Федерации 20.03.2012 г

89. Трубицын В.Г. Цифровое кодирование речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов. [Текст] / А.А Рыболовлев, Г.В. Богачёв, В.Г. Трубицын // ООО "Наука и Технологии", журнал "Телекоммуникации". - 2005. - № 9.-С. 15-19.

90. Трубицын В.Г. Выделение сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием. [Текст] / Научно - технический журнал // Фундаментальные и прикладные проблемы техники и технологии - март - апрель 2010 г. С. 97 - 104.

91. Трубицын В.Г. Способ выделения участков квазистационарности для кодирования речи на основе анализа автокорреляционных зависимостей в речевом сигнале [Текст] / ООО "Наука и Технологии" // Научно - технический журнал "Телекоммуникации". - 2012. - № 4 - С. 20 - 27.

92. Трубицын В.Г. Патент на изобретение "Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов" / Рыболовлев А.А.,

Богачев Г. В., Азаров И. А. // № 2248619. Зарегистрировано в Государственном реестре изобретений Российской Федерации 20 марта 2005 г.

93. Трубицын В.Г. Патент на изобретение "Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием" / A.A. Афанасьев // №2400831 Зарегистрировано в Государственном реестре изобретений Российской Федерации 27 сентября 2010 г.

94. Трубицын В.Г. Патент на изобретение "Способ уменьшения объема данных при широкополосном кодировании речевого сигнала / A.A. Афанасьев // №2432624 Зарегистрировано в Государственном реестре изобретений Российской Федерации 27 октября 2011 г.

95.Уидроу В., Стирнз С. Адаптивная обработка сигналов. - М.: Радио и связь, 1989.

96. Фант Г. Акустическая теория речеобразования: Пер. с англ. - М.: Наука, 1964.-284 с.

97. Фёрстер Э., Ренц Б., Методы корреляционного и регрессионного анализа: Пер. с нем. -М.: Финансы и статистика. 1983.

98. Фирсова A.A. О различиях распределения энергии звуков русской речи и шума / A.B. Болдышев, A.A. Фирсова // Материалы 12-ой Международной конференции и выставки "Цифровая обработка сигналов и её применение. -"DSPA'2010". - Москва. - 2010. - С. 204 - 207.

99. Фланаган Д. Анализ, синтез и восприятие речи. Перевод с английского под редакцией профессора А.А Пирогова - М.: Связь, 1968,- 396с.

100. Харатишвили Н. Г. Дифференциальная импульсно-кодовая модуляция в системах связи. - М.: Радио и связь, 1982. - 136с.

101. Харатишвили Н. Г. Цифровое кодирование с предсказанием непрерывных сигналов. - М.: Радио и связь, 1986. - 140с.

102. Хемминг Р.В. Цифровые фильтры. Перевод с английского В.И. Ер-мишина. Под редакцией профессора A.M. Трахтмана. - М.: Советское радио. 1980.

103. Цыпкин ЯЗ. Информационная теория идентификации. - М.: Наука. Физматлит, 1995.-336с.

104. Цыплихин А.И. Анализ и автоматическая сегментация речевого сигнала: диссертация кандидата технических наук: 05.13.01. Москва, 2006. - 149 с. РГБ ОД, 61:06-5/3138.

105. Chow Gregory С. Tests of equality between sets of coefficients in two linear regressions / Econometrica, - Vol. 28 - № 3 - 1960. - 625 p.

106. Чистович Jl.А., Венцов A.B., Гранстрем М.П. Физиология речи. Восприятие речи человеком. - Л.: Наука, 1976. - 368 е.: ил.

107. Шалимов И.А. Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств: диссертация доктора технических наук: 05.13.17 Москва, 2005 241с. РГБ ОД, 71:06-5/528.

108. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи / Под редакцией О.И. Шелухина - М.: Радио и связь, 2000 - 456 с.

109. Шелухин О.И., Лукьянцев Н.Ф. Патенты RU № 2233010 от 27.01.1999, US №6385577 от 07.05.2002.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.