Специализированное вычислительное устройство фонемной классификации речевых сигналов в реальном времени тема диссертации и автореферата по ВАК РФ 05.13.05, кандидат технических наук Беликов, Иван Юрьевич

  • Беликов, Иван Юрьевич
  • кандидат технических науккандидат технических наук
  • 2013, Новочеркасск
  • Специальность ВАК РФ05.13.05
  • Количество страниц 159
Беликов, Иван Юрьевич. Специализированное вычислительное устройство фонемной классификации речевых сигналов в реальном времени: дис. кандидат технических наук: 05.13.05 - Элементы и устройства вычислительной техники и систем управления. Новочеркасск. 2013. 159 с.

Оглавление диссертации кандидат технических наук Беликов, Иван Юрьевич

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИЗ СОВРЕМЕННЫХ МЕТОДОВ И СИСТЕМ КЛАССИФИКАЦИИ РЕЧЕВЫХ СИГНАЛОВ

1.1 Физиологические особенности формирования речевых сигналов

1.2 Виды систем классификации речи

1.3 Методы спектрального анализа речевых сигналов

1.4 Методы классификации речевых сигналов

1.5 Анализ современного состояния речевых технологий

1.6 Анализ возможной реализации устройства классификации речевых сигналов

Выводы по первой главе

ГЛАВА 2. ЧАСТОТНО-ВРЕМЕННОЙ АНАЛИЗ РЕЧЕВЫХ СИГНАЛОВ

2.1 Анализ и выбор материнской функции вейвлет-преобразования

2.2 Алгоритм вычисления вейвлет-коэффициентов на основе материнской функции Хаара

2.3 Методика формирования речевых признаков

2.3.1 Выбор количества частотных уровней вейвлет-анализа

2.3.2 Алгоритм формирования фонемных признаков

2.4 Метод аппаратной реализации частотно-временного анализа

2.5 Результаты практической реализации частотно-временного анализа

Выводы по второй главе

ГЛАВА 3. ФОНЕМНАЯ МОДЕЛЬ РУССКОГО ЯЗЫКА И МЕТОД ФОНЕМНОЙ КЛАССИФИКАЦИИ

3.1 Фонемная модель речевого сигнала

3.2 Определение фонемных групп на основе бинарного дерева решений

3.3 Параметрическое представление фонем на основе нечеткой логики

3.4 Алгоритм программной реализации фонемной модели

3.5 Программная реализация фонемной модели

Выводы по третьей главе

ГЛАВА 4. РАЗРАБОТКА СПЕЦИАЛИЛЗИРОВАННОГО ВЫЧИСЛИТЕЛЬНОГО УСТРОЙСТВА ФОНЕМНОЙ КЛАССИФИКАЦИИ

4.1 Постановка задачи аппаратной реализации предложенных методов и алгоритмов

4.2 Структурно-функциональная схема устройства

4.3 Диаграмма процессов устройства

4.4 Разработка устройства фонемной классификации

4.5 Результат работы специализированного вычислительного устройства фонемного анализа речевых сигналов

4.6 Технические характеристики устройства и условия эксплуатации

Выводы по четвертой главе

ЗАКЛЮЧЕНИЕ

ЛИТЕРАТУРА

ПРИЛОЖЕНИЕ А. Акт внедрения результатов диссертационной работы в ОАО «Мобильные Телесистемы»

ПРИЛОЖЕНИЕ Б. Свидетельство о государственной регистрации программ

для ЭВМ № 2011617161

ПРИЛОЖЕНИЕ В. Патент на полезную модель №121616

ПРИЛОЖЕНИЕ Г. Программный листинг алгоритма вейвлет-преобразования в среде Scilab 5.2

ПРИЛОЖЕНИЕ Д. Свидетельство о государственной регистрации программ

для ЭВМ №2011617160

ПРИЛОЖЕНИЕ Е. Экранная форма программы «Phoneme synthesizer 1.0»

ПРИЛОЖЕНИЕ Ж. Свидетельство о государственной регистрации программ

для ЭВМ №2012614314

ПРИЛОЖЕНИЕ К. Свидетельство о государственной регистрации программ

для ЭВМ № 2011614904

ПРИЛОЖЕНИЕ Л. Акт внедрения результатов диссертационной работы в ФГУП «РНИИРС»

ПРИЛОЖЕНИЕ М. Программный листинг элемента устройства фонемной классификации «haar»

Рекомендованный список диссертаций по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Специализированное вычислительное устройство фонемной классификации речевых сигналов в реальном времени»

ВВЕДЕНИЕ

Актуальность темы.

В настоящее время активно развиваются информационные системы на основе устройств автоматического анализа речевых сигналов в реальном времени. Одним из эффективных инструментов в развитии информационных систем является использование естественной речи человека при реализации систем голосового управления техническими устройствами и систем преобразования речи в текст. За последние десятилетия исследований были достигнуты определенные успехи в этой области, однако задача в целом все еще далека от своего решения. Существующие на данный момент устройства не имеют возможности для широкого применения, так как работают в режиме классификации небольшого количества отдельных команд. Значительные временные затраты на выполнение процедуры обработки сигнала и его классификации не позволяют применять их в системах реального времени. Также существуют трудности описания фонемных параметров речи из-за сложного процесса речеобразования. Большинство известных коммерческих продуктов с аппаратной реализацией являются дорогостоящими и узкоспециализированными. Для эффективного решения представленных проблем необходим широкий спектр методов и алгоритмов, различающихся по объёму вычислений, качеству получаемых результатов, количеству используемых ресурсов, способам представления данных. Перспективным вариантом развития анализа естественной речи являются системы с фонемным анализом звуков и их последующей интерпретацией. Следует учесть, что в настоящий момент на мировом рынке получили широкое распространение программируемые логические интегральные схемы (ПЛИС), потенциально подходящие для реализации подобных систем. Вышеизложенные обстоятельства позволяют отметить актуальность научно-технической задачи разработки специализированного вычислительного устройства, ориентированного на увеличение эффективности классификации речи на аппаратном уровне. В диссертации рассматриваются теоретические и практические аспекты разработки специализированного вычислительного

устройства фонемной классификации речевых сигналов. Диссертационная работа выполнена в соответствии с НИР по заказу №325 (отчет №140/НИР/1 от 16.01.2013) Федерального государственного унитарного предприятия «Ростовский-на-Дону научно-исследовательский институт радиосвязи»; приоритетным направлением развития науки, технологий и техники РФ «Информационно-телекоммуникационные системы» (утверждено указом Президента РФ №899 от 7 июля 2011 г.); научным направлением ЮРГТУ (НПИ) «Теория, принципы и технологии построения информационно-вычислительных и измерительных систем» (утверждено решением ученого совета университета от 20.09.11 г.).

Объект исследования.

Элементы и устройства цифровой обработки сигналов, методы и алгоритмы классификации непрерывной речи, методы параллельных вычислений.

Целью диссертационной работы является повышение эффективности существующих методов и алгоритмов для классификации речевых сигналов и их реализация в виде специализированного вычислительного устройства фонемного анализа речи в реальном времени.

Для достижения поставленной цели в работе решаются следующие задачи:

1. Анализ современных методов и устройств классификации речи.

2. Анализ фонемной модели речевого сигнала.

3. Разработка метода частотно-временного анализа речевого сигнала в реальном времени на аппаратном уровне.

4. Разработка инвариантного метода классификации речевого сигнала.

5. Экспериментальное исследование и практическая реализация предложенных методов и алгоритмов в виде специализированного устройства на базе программируемых интегральных схем.

Основные положения, выносимые на защиту:

1. Алгоритм частотно-временного анализа речевого сигнала на основе материнской функции Хаара, повышающий эффективность вычисления вейвлет-коэффициентов.

2. Метод аппаратной реализации частотно-временного анализа на основе сигма-дельта модуляции речевого сигнала, позволяющий улучшить технические характеристики специализированного вычислительного устройства.

3. Метод фонемной классификации речевых сигналов на фонемные группы на основе бинарного дерева решений с последующим определением фонемы с использованием аппарата нечеткой логики, позволяющий выполнять инвариантную классификацию фонем.

4. Специализированное вычислительное устройство фонемной классификации речи на основе программируемых логических интегральных схем, позволяющее выполнять фонемную классификацию в режиме реального времени.

Научная новизна:

1. Предложен новый алгоритм вычисления вейвлет-коэффициентов на основе материнской функции Хаара, отличающийся от существующих тем, что использует целочисленные операции и рекурсивную форму вычислений, что позволяет повысить эффективность работы специализированного вычислительного устройства за счет существенного сокращения выполняемых арифметических операций;

2. Предложен метод аппаратной реализации частотно-временного анализа речи на основе сигма-дельта модуляции, отличающийся от существующих тем, что позволяет выполнять вейвлет-анализ на основе однобитового потока с предельной частотой вдвое меньшей частоты работы сигма-дельта модулятора;

3. Предложен метод фонемной классификации речи на основе бинарного дерева решений, который отличается от существующего тем, что использует инвариантную относительно оператора классификацию фонемы к одной из пяти фонемных групп и позволяет улучшить эксплуатационные характеристики устройства;

4. Предложен принцип аппаратной реализации специализированного вычислительного устройства фонемной классификации речи, который отличается

использованием разработанных методов и позволяет повысить качественные и эксплуатационные показатели подобного рода устройств.

Практическая ценность:

1. Предложен алгоритм частотно-временного анализа на основе функции Хаара, который позволяет сократить время на вычисление вейвлет-коэффициентов в исследуемом окне более чем в 5 раз по сравнению с традиционным.

2. Предложен метод аппаратной реализации вейвлет-анализа с использованием сигма-дельта модуляции речевого сигнала, который позволяет вычислять вейвлет-коэффициенты в реальном времени и сократить объём используемых ресурсов в 4.8 раз по сравнению с традиционным (Патент РФ №121616).

3. Предложен метод фонемной классификации на основе усовершенствованного бинарного дерева, который позволяет улучшить эксплуатационные характеристики устройства за счет инвариантной фонемной классификации на отдельные группы, с последующим определением фонемы с использованием аппарата нечеткой логики. Точность фонемной классификации достигает 84 %.

4. Разработано специализированное вычислительное устройство фонемной классификации речи, которое за счет существенного сокращения используемых ресурсов, возможно реализовать на множестве широко распространенных кристаллов программируемых логических интегральных схем, что подчеркивает экономическую эффективность его реализации.

5. Разработано специализированное вычислительное устройство фонемной классификации, которое используется в качестве интерфейса фонемного анализа речи в реальном времени, а так же может являться элементом стандартного интерфейса ПК и использоваться для расширения его функциональных возможностей по предварительной обработке речевых сигналов, снижая нагрузку на центральный процессор и повышая эффективность работы программного обеспечения.

Методы исследования.

При выполнении данной работы использовались методы цифровой обработки сигналов, теории алгоритмов и численных методов, общей фонетики, методы проектирования элементов и устройств, методы математического моделирования, объектно-ориентированного программирования. Проводились исследования на модельных и реальных сигналах.

Достоверность подтверждается корректным применением метода частотно-временного анализа речевых сигналов; применением фундаментальной теории речеобразования; подтверждением теоретических положений результатами экспериментов; критическим обсуждением полученных результатов на Всероссийских и международных научных конференциях и внедрением разработанного устройства; основные положения работы хорошо согласуются с опубликованными материалами других авторов.

Апробация работы.

Результаты работы докладывались и обсуждались на различных научно-технических конференциях: ежегодных конференциях профессорско-преподавательского состава, научных работников, аспирантов и студентов ЮРГТУ(НПИ) (Новочеркасск, 2010-2011 гг.); Всероссийской научной школе «Микроэлектронные информационно-управляющие системы и комплексы» (Новочеркасск, 2011 г.); Международной научно-практической конференции «Микропроцессорные, аналоговые и цифровые системы: проектирование и схемотехника, теория и вопросы применения» (Новочеркасск, 2011-2012 гг.); Всероссийском ежегодном конкурсе научно-исследовательских работ студентов, аспирантов и молодых ученых «ЭВРИКА» (Новочеркасск, 2011-2012 гг.); Международной научно-практической конференции «Информационные технологии. Радиоэлектроника. Телекоммуникации» (Тольятти, 2012 г.); Всероссийской научной конференции молодых ученых, аспирантов и студентов «ТЕХНИЧЕСКАЯ КИБЕРНЕТИКА, РАДИОЭЛЕКТРОНИКА И СИСТЕМЫ» (Таганрог, 2012 г.); Международной молодежной конференции «Академические фундаментальные исследования молодых ученых России и Германии в условиях

глобального мира и новой культуры научных публикаций» (Новочеркасск, 2012 г.); Международной научно-практической конференции «МОДЕЛИРОВАНИЕ. ТЕОРИЯ, МЕТОДЫ И СРЕДСТВА» (Новочеркасск, 2013 г.).

Публикации.

По теме диссертации опубликовано 25 печатных работ, в том числе: 5 статей в ведущих рецензируемых изданиях, рекомендованных ВАК РФ; 14 статей опубликованных по результатам научно-практических конференций, 5 свидетельств о государственной регистрации программы для ПЭВМ, 1 патент РФ на полезную модель.

Внедрение.

Результаты работы в виде опытного образца устройства фонемной классификации речи внедрены в ОАО «Мобильные ТелеСистемы» г. Ростов-на-Дону (ПРИЛОЖЕНИЕ А), в виде комплекса программ по результатам НИР по заказу №325 (отчет №140/НИР/1 от 16.01.2013) в Федеральном государственном унитарном предприятии «Ростовский-на-Дону научно-исследовательский институт радиосвязи», г. Ростов-на-Дону (ПРИЛОЖЕНИЕ Л). Результаты работы так же используются в учебном процессе при выполнении научных исследований и выпускных квалификационных работ студентов и магистров ЮжноРоссийского государственного технического университета, г. Новочеркасск.

Структура работы.

Материал основной части диссертационной работы изложен на 129 страницах машинописного текста. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 108 наименований, содержит 11 таблиц, 47 рисунков, и 10 приложений на 29 листах. Общий объём диссертации составляет 159 страниц.

Содержание работы.

В первой главе работы выполнен аналитический обзор существующих методов и алгоритмов, а так же устройств классификации речевых сигналов. Проанализированы достоинства, недостатки, а также перспективы реализации

специализированного вычислительного устройства фонемной классификации речевых сигналов.

Во второй главе выполняется анализ и выбор материнской функции вейвлет-преобразования. Описывается предлагаемый алгоритм вычисления вейвлет-коэффициентов на основе материнской функции Хаара и его применение в задаче анализа речевых сигналов на аппаратном уровне. Предлагается алгоритм формирования фонемного признака. Анализируется эффективность алгоритма частотно-временного анализа по сравнению с традиционным.

В третьей главе анализируется фонемная модель речевого сигнала. Предлагается метод классификации на отдельные инвариантные фонемные группы на основе бинарного дерева решений. Предлагается метод классификации на основе степени принадлежности фонем внутри группы с использованием треугольной функции нечеткой логики. Предлагается структура речевого сигнала, учитывающая межфонемные переходы. Предложены параметры фонем для каждой из фонемных групп.

В четвертой главе рассматриваются особенности реализации специализированного вычислительного устройства фонемной классификации на базе программируемых логических интегральных схем. Предлагается структурно-функциональная схема и диаграмма процессов устройства, а так же непосредственная схема устройства и её составные элементы. Приведен пример практического применения результатов работы специализированного вычислительного устройства. Представлены технические требования по эксплуатации.

В заключении излагаются основные результаты диссертационной работы.

Похожие диссертационные работы по специальности «Элементы и устройства вычислительной техники и систем управления», 05.13.05 шифр ВАК

Заключение диссертации по теме «Элементы и устройства вычислительной техники и систем управления», Беликов, Иван Юрьевич

Выводы по четвертой главе

Подводя итог можно отметить, что:

1. Современный уровень технологического развития программируемых логических интегральных схем позволяет полностью реализовать предлагаемые методы и алгоритмы на одном кристалле микросхемы. За счет массового параллельного выполнения вычислительных процессов повышается эффективность их использования на аппаратном уровне.

2. Описание процессов и их планирование, позволяет сформировать конечный результат работы устройства всего за 13 временных интервалов, что дает возможность функционирования предлагаемого устройства в режиме реального времени с временной задержкой 30 мкс. Такой результат говорит о высоком техническом уровне устройства фонемного анализа речи.

3. Описание разработанного устройства на основе универсального языка УНЕ)Ь и небольшое количество потребляемых ресурсов позволяет использовать микросхемы ПЛИС любой серии начального ценового диапазона. Такой подход к реализации устройства говорит о его экономической эффективности.

4. В результате экспериментальных исследований установлено, что точность фонемной классификации достигает 84 %. Такой результат подтверждает обоснованность и достоверность принятых решений, а так же эффективность использования устройства для множества прикладных задач.

5. Разработанное специализированное вычислительное устройство используется в качестве универсального интерфейса фонемного анализа речи в реальном времени и в зависимости от задачи на прикладном уровне может использоваться в системах: голосового управления техническими устройствами, преобразования речи в текст, интерактивного ввода информации, управления робототехникой, расширения функциональных возможностей периферийных устройств ПЭВМ.

При реализации устройств автоматической классификации любого языка существует три основных проблемы: анализ естественно произнесенной речи, зависимость от особенности произношения оператора и скорость получаемого результата. В диссертационной работе предложены эффективные методы и алгоритмы и их реализация в виде специализированного вычислительного устройства на базе программируемой логики с целью улучшения технико-экономических и эксплуатационных характеристик. Основные результаты работы следующие:

1. Предложен алгоритм частотно-временного анализа на основе функции Хаара, который позволяет сократить время на вычисление вейвлет-коэффициентов в исследуемом окне более чем в 5 раз по сравнению с традиционным.

2. Предложен метод аппаратной реализации вейвлет-анализа с использованием сигма-дельта модуляции речевого сигнала, который позволяет улучшить технические характеристики устройства за счет вычисления вейвлет-коэффициентов в реальном времени и сократить объём используемых ресурсов в 4.8 раз по сравнению с традиционным (Патент РФ №121616).

3. Предложен метод фонемной классификации на основе усовершенствованного бинарного дерева, который позволяет улучшить эксплуатационные характеристики устройства за счет инвариантной фонемной классификации на отдельные группы, который имеет простую реализацию на базе устройств с программируемой логикой.

4. Разработано специализированное вычислительное устройство фонемной классификации речи, которое за счет существенного сокращения используемых ресурсов, возможно реализовать на множестве широко распространенных кристаллов программируемых логических интегральных схем, что подчеркивает экономическую эффективность его реализации. Устройство внедрено и успешно используется в ОАО «Мобильные ТелеСистемы» г. Ростов-на-Дону в качестве опытного образца, а так же при выполнении научных исследований и выпускных квалификационных работ студентов и магистров Южно-Российского государственного технического университета.

5. Разработано специализированное вычислительное устройство, которое используется в качестве интерфейса фонемного анализа речи в реальном времени, а так же может являться элементом стандартного интерфейса ПК и использоваться для расширения его функциональных возможностей по предварительной обработке речевых сигналов, снижая нагрузку на центральный процессор и повышая эффективность работы программного обеспечения.

6. В результате экспериментальных исследований установлено, что точность фонемной классификации достигает 84 %. Такой результат подтверждает обоснованность и достоверность принятых решений, а так же эффективность использования устройства для множества прикладных задач в области вычислительной техники и систем управления.

Научная значимость полученных результатов заключается в разработке новых методов синтеза вычислительного устройства для фонемного анализа речевых сигналов в реальном времени.

Практическая значимость полученных результатов заключается в реализации устройства фонемного анализа речи с улучшенными технико-экономическими характеристиками, в качестве элемента систем преобразования речи в текст и управления техническими устройствами.

В данной диссертационной работе на примере использования устройства на основе платы DE2-115 показано, что результаты экспериментов указывают на высокую эффективность применения предложенных методов и алгоритмов. Полученные характеристики устройства не хуже соответствующих характеристик аналогичных систем, а в некоторых аспектах превосходят их. Перспективным направлением дальнейшего развития устройства является синтаксический и

Список литературы диссертационного исследования кандидат технических наук Беликов, Иван Юрьевич, 2013 год

ЛИТЕРАТУРА

¡.Аграновский, A.B. Теоритические аспекты алгоритмов и классификации речевых сигналов /A.B. Аграновский, Д.А. Леднов. -М.: «Радио и связь», 2004. -164 с.

2. Армстронг, Д. Р. Моделирование цифровых систем на языке VHDL. Концепция моделирования на уровне ИС : пер. с англ. / Д.Р. Армстронг; Под ред. Ю. А. Татарникова. - М. : Мир, 2004. - 175 с.

3. Ашихмин, А. С. Цифровая схемотехника : Современный подход / A.C. Ашихмин. - М. : Десс ТехБук, 2007. - 288 с.

4. Беликов, И.Ю. Классификация одномерных сигналов./И.Ю. Беликов, О.Ф. Ковалев //Студенческая научная весна-2010 : материалы регион, науч.-техн. конф. студентов, аспирантов и молодых ученых вузов Ростовской обл. / Юж,-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ -2010. - с. 8-9.

5. Беликов, И.Ю. Метод поиска общих признаков в одномерных сигналах / И.Ю. Беликов, О.Ф. Ковалев // Результаты исследований - 2010 : материалы 59-й науч.-техн. конф. профессорско-преподавательского состава, науч. работников, аспирантов и студентов ЮРГТУ (НПИ) / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ, 2010. - с. 214-215.

6. Беликов, И.Ю. Алгоритм поиска резонансных частот в одномерных сигналах / И.Ю. Беликов, О.Ф. Ковалев // Результаты исследований - 2011 : материалы 60-й науч.-техн. конф. профессорско-преподавательского состава, науч. работников, аспирантов и студентов / Юж.-Рос. гос. техн. ун-т (НПИ). -Новочеркасск : ЮРГТУ (НПИ), 2011. -с. 25-26.

7. Беликов, И.Ю. Фонемный анализ речевых сигналов на ПЛИС / И.Ю. Беликов, О.Ф. Ковалев // Микропроцессорные, аналоговые и цифровые системы : проектирование и схемотехника, теория и вопросы применения : материалы XI Междунар. науч.-практ. конф., г Новочеркасск, 22 апр. 2011г. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ (НПИ), -2011. -ч;. 7-8.

8. Беликов, И.Ю. Метод автоматической классификации непрерывной речи / И.Ю. Беликов, О.Ф.Ковалев // Сборник работ победителей отборочного тура

Всероссийского конкурса научно-исследовательских работ студентов, аспирантов и молодых ученых по нескольким междисциплинарным направлениям [Эврика 2011], г. Новочеркасск, окт.-нояб. 2011г./ Юж.-Рос. гос. тех. ун-т (НПИ). - Новочеркасск : ЛИК, -2011. - с. 3—4.

9. Беликов, И.Ю. Математические методы фонемной классификации речевых команд / И.Ю. Беликов, О.Ф. Ковалев // Вестник СГТУ - 2011. -№4(62) -с. 229-232.

10. Беликов, И.Ю. Методы и алгоритмы фонемного анализа речевых сигналов. / И.Ю. Беликов, О.Ф. Ковалев // Методы и алгоритмы прикладной математики в технике, медицине и экономике: материалы XII Междунар. научно-практ. конф., г. Новочеркасск -2011. -с. 19-21.

11. Беликов, И.Ю. Фонемная классификация речевых сигналов/ И.Ю. Беликов, О.Ф. Ковалев// Сборник работ победителей отборочного тура Всероссийского конкурса научно-исследовательских работ студентов, аспирантов и молодых ученых по нескольким междисциплинарным направлениям [Эврика 2012], г. Новочеркасск, май-июль 2012г. / Юж.-Рос. гос. тех. ун-т (НПИ). -Новочеркасск : Лик, -2012. - с. 3-5.

12. Беликов, И.Ю. Математическое моделирование речевых сигналов на основе нечеткой логики/ И.Ю. Беликов// Известия высших учебных заведений Северо-Кавказский Регион, Технические науки, г. Новочеркасск : / Юж.-Рос. гос. тех. ун-т (НПИ), №5, -2012.-е. 20-24.

13. Беликов, И.Ю. Анализ формантных признаков речевого сигнала в квазиреальном времени на программируемых логических интегральных схемах /И.Ю. Беликов, О.Ф. Ковалев// Известия высших учебных заведений. Электромеханика, г. Новочеркасск : ./ Юж.-Рос. гос. тех. ун-т (НПИ), №5, -2012.-е. 78-80.

14. Беликов, И.Ю. Анализ речевого сигнала на основе сигма-дельта модуляции. Информационные технологии. Радиоэлектроника. Телекоммуникации (1ТЯТ-2012)/И.Ю. Беликов, О.Ф. Ковалев// Сб. ст. II Междунар. заоч. науч.-техн.

конф., г. Тольятти, 2012г. / Поволжский гос. техн. ун-т сервиса - Тольятти: изд-во ПВГУС -2012. -с. 183-186.

15. Беликов, И.Ю. Анализ современного состояния речевых технологий/Р.В. Базаров, И.Ю. Беликов// Студенческая научная весна - 2012 : материалы регион, науч.-техн. конф. студентов, аспирантов и молодых ученых вузов Ростовской обл. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ, -2012.-с. 4-5

16. Беликов, И.Ю. Формирование фонемного кода на базе цифровой логики в квазиреальном времени./И.Ю. Беликов// Академические фундаментальные исследования молодых ученых России и Германии в условиях глобального мира и новой культуры научных публикаций. Материалы междунар. молодежи, конф., г. Новочеркасск , 4-5 октября/ Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ, ЛИК -2012. -с. 142-144.

17. Беликов, И.Ю. Фонемный анализ речи в цифровых системах/И.Ю. Беликов// XI Всероссийская науч. конф. молодых ученых, аспирантов и студентов «Техническая кибернетика, радиоэлектроника и системы», г. Таганрог, Том 1, ТТИ ЮФУ -2012,- с. 50-51.

18. Беликов, И.Ю. Метод поиска формантных частот в речевом сигнале на основе быстрого алгоритма вейвлет-преобразования Хаара / И.Ю. Беликов, О.Ф. Ковалев// Известия высших учебных заведений Северо-Кавказский Регион, Технические науки, г. Новочеркасск : Юж.-Рос. гос. тех. ун-т (НПИ), №1,-2012.-с. 13-16.

19. Беликов, И.Ю. Особенности классификации голосовых и глухих фонем русского языка / И.Ю. Беликов, О.Ф. Ковалев// Известия высших учебных заведений Северо-Кавказский Регион, Технические науки, г. Новочеркасск: Юж.-Рос. гос. тех. ун-т (НПИ), №1,-2013.-с. 15-17.

20. Беликов, И.Ю. Аппаратная реализация параметров фонемной модели на основе языка УНГ)Ь/ И.Ю. Беликов// Моделирование теория, методы и средства: материалы XIII Междунар. науч.-практ. конф., г Новочеркасск, 27

февр. 2013г. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЮРГТУ (НПИ), -2013. -с. 16-17.

21. Бибило, П.Н. VHDL. Эффективное использование при проектировании цифровых систем /П.Н. Бибило, H.A. Авдеев . -М.: СОЛОН-Пресс, 2006. -344 с.

22. Бондаренко, Л.В. Основы общей фонетики / Л.В. Бондаренко, Л.А. Вербицкая, М.В. Гордина. - СПб: Издательство СПбГУ , 1991. -152 с.

23. Винцюк, Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винцюк. - Киев: «Наук. Думка», 1987.

24. Воробьев, В.И. Теория и практика вейвлет-преобразования/В.И. Воробьев, В.Г. Грибунин. — Спб.: Изд-во Военного ун-та связи, 1999. -204 с.

25. Выходцев, A.B. Справочник по радиовещанию/ A.B. Выходцев, В.М. Захарин, Е.М. Рудый и др. -Киев: Техника, 1981. -264 с.

26. Голуб, В.. Цифровая обработка сигналов: Сигма-дельта АЦП/В. Голуб. -Электроника : НТБ, 2001, № 4, -с. 22-26.

27. Голуб, В.. Усилители мощности класса D: Сигналы управления/В. Голуб.

— М.: ЭЛЕКТРОНИКА: Наука, Технология, Бизнес, 2008,№3, -с. 90-96.

28. Грушвицкий, Р.И. Проектирование систем на микросхемах с программируемой структурой : учеб. пособие для вузов] / Р.И. Грушвицкий, А.Х. Мурсаев, Е.П. Угрюмов . — 2-е изд.. — СПб. : БХВ-Петербург, 2006.

— 736 с.

29. ГОСТ Р 7.0.11-2011 Система стандартов по информации, библиотечному и издательскому делу. Диссертация и автореферат диссертации. Структура и правила оформления. - М.: Стандартинформ, 2011. - 10 с.

30. ГОСТ 2.743-91 Межгосударственный стандарт. Единая система конструкторской документации. Обозначения условные графические в схемах. Элементы цифровой техники. - М.: ИПК Издательство стандартов, 2003.-44 с.

31. Деркач, М.Ф. Динамические спектры речевых сигналов/ М.Ф. Деркач, Р.Я. Гумецкий, Б.М. Гура. -М.: Изд-во Львовского ун-та, 1983. - 289 с.

32. Дремин, И.М. Вейвлеты и их использование/ И.М. Дремин, О.В. Иванов,

B.А. Нечитайло. —М.: Изд-во Физич. ин-та им. П.Н. Лебедева, 2001. -561 с.

33. Ермоленко, Т.В. Разработка системы распознавания изолированных слов русского языка на основе вейвлет-анализа/ Т.В. Ермоленко// Искусственный интеллект. №4, Украина, Киев - 2005.-е. 595 -601.

34. Ермоленко, Т.В. Фонетический анализ речевого сигнала на основе вейвлет-разложения/Т.В. Ермоленко // Искусственный интеллект. Украина, №3, Киев -2003.-е. 409-416.

35. Ермоленко, Т.В. Применение вейвлет-преобразования для обработки и распознавание речевых сигналов/Т.В. Ермоленко// Искусственный интеллект. Украина, №4, Киев - 2002. -с. 200-208.

36. Звегинцев, В.А. Новое в лингвистике, Выпуск 2/В.А. Звегенцев - М.: Издательство иностранной литературы, 1961. - 637 с.

37. Золотухо, P. System Designer - пакет для разработки устройств на основе Atmel FPSLIC/ Р. Золотухо // Chip News. -2001.- с. 8 — 14.

38. Зотов, В. Ю. Проектирование встраиваемых микропроцессорных систем на основе ПЛИС фирмы Xilinx / В.Ю. Зотов. -М. : Горячая линия-Телеком, 2006. -520 с.

39. Инновационные исследования в распознавании речи и их коммерциализация [Электронный ресурс]/Электрон. дан. - Режим доступа: http://www. istrasoft. ги, свободный

40. Карпов, A.A. Модели и программная реализация распознавания русской речи на основе морфемного анализа: дис. ... канд. техн. наук : 05.13.11/Карпов Алексей Анатольевич -СПб, 2007. - 132 с.

41. Кельманов, A.B. О некоторых проблемах построения систем распознавания инвариантных к диктору/ A.B. Кельманов // Тезисы АРСО-15, Таллинн, ИК АН ЭССР, -1989. -с. 103-104.

42. Кириллов, С.Н. Анализ речевых сигналов на основе акустической модели /

C.Н. Кириллов, Д.Н. Стукалов. -М.Техническая кибернетика, № 2, 1994. -с. 147-153.

43. Ковалев, О.Ф. Реализация цифровых мультипроцессорных систем управления на базе встраиваемых систем программируемых логических интегральных схем/ О.Ф. Ковалев, И.Ю. Беликов, М.О. Ковалева и др. // Микроэлектронные информационно-управляющие системы и комплексы : сб. тез. и статей Всерос. науч. шк., Новочеркасск, 5-7 сент.2011г. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск : ЛИК, -2011. - с. 18-21.

44. Коганов, A.B. Алгоритм выделения примитивов в задаче автоматической идентификации музыкальных записей/ A.B. Коганов, М.А. Коганов, П.П. Кольцов, Ф.В. Птицын //М: Информационные технологии и вычислительные системы, № 2, -2002-с. 66-73.

45. Кодзасов, C.B. Общая фонетика/ C.B. Кодзасов, О.Ф. Кривнова.-М. : Рос. гос. гуманит. ун-т, -2001. -592 с.

46. Круглов, В.В. Искусственные нейронные сети. Теория и практика / В.В. Круглов, В.В. Борисов -М.: Горячая линия-Телеком, 2001. -384 с.

47. Лабутин, В.К. Слух и анализ сигналов./ Лабутин, В.К. Молчанов А.П. -М.: «Энергия», 1967. -79 с.

48. Максфилд, К. Проектирование на ПЛИС. Курс молодого бойца/ К. Максифлд. -М.: «Додэка-ХХ1», 2007. - 408 с.

49. Маркел, Д.Д. Линейное предсказание речи. Пер. с англ. /Д.Д. Маркел, А.Х. Грэй; под ред. Ю.Н. Прохорова и B.C. Звездина. - М.: Связь, 1980 - 308 с.

50. Мясникова, E.H.. Обьективное распознавание звуков речи. /E.H. Мясникова -Л.: «Энергия» , 1967. - 151 с.

51. Ниценко, A.B. Алгоритм пофонемного распознавания слов наперед заданного словаря./А.В. Ниценко, В.Ю. Шелепов // Искусственный интеллект. Украина, №4, Киев - 2004. -с. 633-639.

52. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.B. Аграновский, Т.К. Винцюк и др. - М:Изд. дом «Народное образование», № 1, -2010. -111 с.

53. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.B. Аграновский, Т.К. Винцюк и др. - М:Изд. дом «Народное образование», № 2, -2010. -94 с.

54. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.J1. Ронжин, В.Р. Женило и др. - М:Изд. дом «Народное образование», № 3, -2010. -122 с.

55. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.JT. Ронжин, В.Р. Женило и др. - М:Изд. дом «Народное образование», № 4, -2010. -94 с.

56. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.JI. Ронжин, В.Р. Женило и др. - М:Изд. дом «Народное образование», № 1, -2012. -96 с.

57. Потапова, Р.К. Речевые технологии/ Р.К. Потапова, A.JI. Ронжин, В.Р. Женило и др. - М:Изд. дом «Народное образование», № 2, -2012. -112 с.

58. Потехин, Д. С. Разработка систем цифровой обработки сигналов на базе ПЛИС / Д.С. Потехин, И.Е. Тарасов. -М. : Горячая линия-Телеком, 2007. -248 с.

59. Рабинер, Л.Р. Цифровая обработка сигналов/ Л.Р. Рабинер, Р.В. Шафер. -М.: Радио и связь, 1981.-495 с.

60. Рутковская, Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рутковская, М. Пилиньский, Л. Рутковский. - М.: Горячая линия-Телеком, 2007. - 452 с.

61. Сапожков, М.А. Речевой сигнал в кибернетике и связи/ М.А. Сапожков. -М: Связь и радио, 1963. - 452 с.

62. Синецкий, P.M. Структурно-аппроксимационные методы распознавания речевых образов и их применение в тренажно-моделирующих системах : дис. ... канд. техн. наук : 05.13.01/Синецкий Роман Михайлович -Новочеркасск, 2008.-215 с.

63. Смоленцов, Н.К. Основы теории вейвлетов. Вейвлеты в МАТГАВ/ Н.К. Смоленцов. — М.: ДМК Пресс, 2005. - 304 с.

64. Справочное руководство пользователя отладочной платы Terasic DE2-115 [Электронный ресурс] / Электрон. дан. - Режим доступа: http://www.terasic.сот, свободный.

65. Стешенко, В. Программируемые логические интегральные схемы: обзор архитектур и особенности применения / В. Стешенко// Схемотехника. - 2000. -с.22 -24.

66. Стешенко, В. ПЛИС фирмы Altera: элементная база, система проектирования и языки описания аппаратуры/ В. Стешенко.— М. «Додека XXI»: 2007. - 572 с.

67. Стэл - Компьютерные Системы. Распознавание речи, речевые технологии [Электронный ресурс] / Электрон. дан. - Режим доступа: http: //www. s tel. ги/'speech/, свободный.

68. Суворова, Е. А. Проектирование цифровых систем на VHDL/E.A. Суворова, Ю.Е. Шейнин. -СПб. : БХВ-Петербург, 2003. - 576 с.

69. Тарасов, И.Е. Разработка цифровых устройств на основе ПЛИС Xilinx с применением языка VHDL/ И.Е. Тарасов. -М. : Горячая Линия - Телеком, 2005. -256 с.

70. Постановка задачи оптимизации и численные методы ее решения [Электронный ресурс], 2011 / Режим доступа: http://matlab.exponenta.ru/optimiz/book_2/2_l .php, свободный.

71. Угрюмов, Е. П. Цифровая схемотехника : учеб. пособие / Е.П. Угрюмов. -СПб. : БХВ-Петербург, 2004. - 528 с.

72. Уэйкерли, Дж. Ф. Проектирование цифровых устройств / Дж. Ф. Уэйкерли. - М.: Постмаркет, 2002. - 1072 с.

73. Фант, Г. Акустическая теория речеобразования / Г. Фант. — М.: Наука,

1964.-284 с.

74. Федоров, Е.Е. Количественный анализ шумных глухих щелевых и смычно-щелевых звуков/ Е.Е. Федоров, И.А. Шевцова// Искусственный интеллект, №3. Украина, Киев - 2005. - с. 308-313.

75. Федоров, Е.Е. Численное исследование шипящих согласных звуков / Е.Е. Федоров, И.А. Шевцова// Искусственный-интеллект, №4. Украина, Киев -2004.-с. 661-665.

76. Фланаган, Д.Л. Анализ, синтез и восприятие речи/Д.Л. Фаланган. — М.: Связь, 1968.-396 с.

77. Фу, К. Структурные методы в распознавании образов. Пер с англ./ К. Фу. -М.: Мир, 1977.-320 с.

78. Чистович, Л.А. Физиология речи. Восприятие речи человеком/ Л.А. Чистови, А.В. Венцо, М.П. Гранстрем и др. - СПб.: «Наука», 1976. - 195 с.

79. Шарий, Т.В. О проблеме параметризации речевого сигнала в современных системах распознавания речи/Т.В. Шарий//. Вестник Донского нац. ун-та, Сер. А: Природные науки, Выпуск 2, -2008. - с. 536-541.

80. Шевелев, А. Нейронные сети и распознавание образов / А. Шевелев // Программист, №10. - 2001.-е. 54-66

81. Шелепов, В.Ю.К проблеме фонемного распознавания/ В.Ю. Шелепов, В.Ю. Ниценко // Искусственный интеллект, №4. Украина, Киев - 2005. -с. 662-668.

82. Штовба, С.Д. Проектирование нечетких систем средствами Matlab/ С.Д. Штовба. -М.: Горячая линия Телеком, 2007. - 288 с.

83. Aamir, К. Speech recognition: Increasing efficiency of support vector machines/ К Aamir,F. Muhammad, A. Asar// International Journal of Computer Applications (0975-8887), Volume 35- №7, December 2011.

84. AT&T Lab Research. Watson ASR [Электронный ресурс] / Электрон, дан. -Режим доступа: http://www.research.att.com/, свободный.

85. Broersma, M. Speech recognition begins to makes itself heard. [Электронный ресурс] / Электрон, дан. - Режим доступа: http://www. news.zdnet.co.uk/, свободный.

86. Carlos A., David Lopez Sanzo, Kanwen Wu. Speech recognition using FPGA technology/A. Carlos, D. L. Sanzo, W. Kanwen// Canada, Montreal. Design Project Laboratory ECSE 494, June 18, -2007. -p. 120-148.

87. Dutta, R. Speaker verification for security systems using Spartan 6./R. Dutta, S. Dutta,K. Mitra //International journal of electronics and communications (IJEC), Volume - 1, Issue -1, August -2012. -p. 261-278.

88. Haitao, Z. Design and implementation of speech recognition system based on Field Programmable Gate Array/Z. Haitao // Tianjin Polytechnic University -China, Vol.3, №8, August 2009. CCSE journal [Электронный ресурс]/Электрон. дан. - Режим доступа: http://www.ccsenet.org/journal.html, свободный.

89. Huang, X. Spoken Language Processing: a guide to theory, algorithm, and system development / X. Huang, A. Acero, H.-W. Hon. - USA, New Jersey: Prentice-Hall, 2001.

90. Hutchens J.L. Natural Language Grammatical Inference [Электронный ресурс] / J.L. Hutchens.// Электрон. дан. - Режим доступа: h ttp://с iteseerx. ist.psu. edu/viewdoc/download?doi=10.1.1.33.6009&rep

91. Karthikeyan, N. Silicon technologies for speaker independent speech processing and recognition systems in noisy environments/N. Karthikeyan ,J. Mala J.,S. Arun //Madras institute of technology, India. Source: Speech recognition, technologies and applications, November 2008, I-tech, Croatia, -p. 495-526.

92. Keogh, E.J. "Derivative Dynamic Time Warping" [Электронный ресурс] / Keogh, E.J., Pazzani, M.J. //First SIAMInternational Conference on Data Mining - Chicago, IL, 2001 / Электрон. дан. - Режим доступа: http://www. ics. uci. edu/~pazzani/Publications/keogh-kdd.pdf свободный.

93. Microsoft Speech Technologies [Электронный ресурс] / Электрон, дан. -Режим доступа: http://www.microsoft.com/speech/, свободный.

94. Ostendorf М. From HMM's to Segment Models: A Unified View of Stochastic Modeling for Speech Recognition / M. Ostendorf, V.V. Digalakis, O.A. Kimball // Trans, of IEEE on Speech and Audio Processing- 1996.-№ 5 (9),.-p. 360-378.

95. Philips Speech Recognition [Электронный ресурс] / Электрон, дан. - Режим доступа: http://www. speechrecognition.philips. сот/, свободный.

96. Rabiner, L.R. A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition / L.R. Rabiner//Proc. of IEEE. -1989.-№ 77 (2).-p. 257-286.

97. Rabiner, L.R. Fundamentals of speech recognition/L.R. Rabiner, B.H Jang // — New Jersey: Prentice Hall PTR, Englewood Cliffs, -1993. -p. 152-176.

98. Rambabu, D. Speech recognition of industrial robot./D. Rambabu, R. Naga Raju, B. Venkatesh // International journal of computational mathematical ideas, Volume 3, №2, pages 92-98, 2011. [Электронный ресурс]/Электрон. дан. - Режим доступа: http://www.ijcmi.webs.com, свободный.

99. Sergiu, N. Hardware speech recognition for user interfaces in low cost, low power devices/ N. Sergiu, K. Patra, A. Brewer. // Department of electrical engineering and computer science - USA, Berkeley, DAC- 2005. -p. 172-196.

100. Seymore, K. Learning Hidden Markov Model Structure for Information Extraction [Электронный ресурс] / К. Seymore, A. McCallum, R. Rosenfeld // AAAI 99 Workshop on Machine Learning for Information Extraction./Режим jXOCiyna.:http://www. ri. emu. edu/pub jfiles/pub 1 /seymore_kristie_l999_//seymore_k ristie_1999_l.pdf свободный. - Электрон, версия печ. публикации.

101. Pan, S. Chin-Chin Lai, Bo-Yu Tsai. The implementation of speech recognition systems on FPGA-based embedded systems with SOC architecture/ S. Pan, C. Lai, B. Tsai // Department of computer science and information engineering - Taiwan, National university of Kaohsiung, ICIC Vol. 7,-2011. - p. 212-220.

102. Tebelskis, J. Speech Recognition using Neural Networks [Электронный ресурс] / J. Tebelskis // PhD thesis, School of Computer Science, Pittsburgh, 1995. / Электрон, дан. - Режим доступа: http://www.is.cs.cmu.edu/papers/speech/phd-thesis/thesis.joe.ps.gz, свободный.

103. Thiang, W. Speech recognition using linear predictive coding and artificial neural network for controlling movement of mobile robot./ W. Thiang, S. Wijoyo // International conference on information and electronics engineering, IPCSIT, Volume 6, Singapore, -2011, - p. 179-183.

104. Voice Recognition. 21st Century Eloquence, Inc. [Электронный ресурс] / Электрон, дан. - Режим доступа: http://www.voicerecognition.com/, свободный.

105. Whittington, J. FPGA Implementation of spectral subtraction for automotive speech recognition/J. Whittington, D. Kapeel ,M. Michael //IEEE Workshop on Computational Intelligence in vehicles and vehicular Systems, 30 March — 2 April, 2009, Nashville,TN. [Электронный ресурс]/Электрон. дан. - Режим доступа: http://eprints.qut.edu.aU/20394/l/c20394.pdf, свободный.

106. Xiang-mo, Z. An Improved Wavelet Filtering Algorithm and Its FPGA Implementation /Z. Xiang-mo, F. Hui, X. Shi, L. Yang //I.J. Information Technology and Computer Science, 2010, №2, p. 17-24.

107. Young, С. FPGA-based implementation of real-time continuous speech recognizer/C. Young-kui, K. You, W. Sung. // Seul National University, Korea, 2008. [Электронный ресурс]/Электрон. дан. - Режим доступа: http://msl.snu.ас.кг, свободный.

108. Zhang, X. A Scalable Architecture for Discrete Wavelet Transform on FPGA-BasedSystem/X. Zhang//InTech Europe 2011. [Электронный ресурс]/Электрон. дан. - Режим доступа '.http://www.intechopen.com/books/discrete-wavelet-transforms-algorithms-andapplications/a-scalable-architecture-for-discrete-wavelet-transform-on-fpga-based-system, свободный.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.