Методы обработки речевых сигналов и система обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Алимурадов Алан Казанферович
- Специальность ВАК РФ00.00.00
- Количество страниц 398
Оглавление диссертации доктор наук Алимурадов Алан Казанферович
ВВЕДЕНИЕ
ГЛАВА 1. СПЕЦИФИКА И ПРОБЛЕМЫ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ
1.1. Проблемы обнаружения и классификации эмоциональных состояний человека
1.1.1. Актуальность обнаружения и классификации эмоциональных состояний человека в экстремальных условиях
1.1.2. Эмоциональные состояния и эмоции человека
1.1.3. Специфика обнаружения и классификации эмоциональных состояний человека
1.2. Особенности психофизиологического формирования речи
1.3. Обзор информативных параметров речевых сигналов, релевантных эмоциональным состояниям человека
1.4. Задачи обработки и анализа речевых сигналов
1.4.1. Предварительная обработка речевых сигналов
1.4.2. Фильтрация и подавление помех в речевых сигналах
1.4.3. Сегментация речевых сигналов на информативные участки
1.4.4. Определение информативных параметров речевых сигналов
1.5. Способы классификации эмоциональных состояний человека
Выводы по главе
ГЛАВА 2. МЕТОДОЛОГИЯ ОБРАБОТКИ И АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ ДЛЯ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ КРИТИЧЕСКИХ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА
2.1. Разработка методологии исследования
2.2. Разработка информационного обеспечения средства хранения
и интерпретации данных эмоциональной речи
2.2.1. Анализ известных баз данных эмоциональной речи
2.2.2. Создание средства хранения и интерпретации естественной эмоциональной речи
2.3. Обзор методов обработки речевых сигналов для обнаружения
и классификации эмоциональных состояний человека
2.4. Критический анализ модификаций декомпозиции
на эмпирические моды
2.5. Система оценок методов и системы обнаружения и классификации эмоциональных состояний человека
в экстремальных условиях
Выводы по главе
ГЛАВА 3. РАЗРАБОТКА МЕТОДОВ ОБРАБОТКИ И АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ ДЛЯ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ КРИТИЧЕСКИХ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА
3.1. Разработка и исследование математической модели представления речевых сигналов на основе модификаций декомпозиции
на эмпирические моды
3.2. Разработка метода подавления помех на основе формирования комбинированных речевых сигналов и анализа остаточного шума
3.3. Разработка метода сегментации на информативные участки
на основе пороговой обработки и исправления ошибок сегментации
3.4. Разработка метода определения информативно-значимых параметров, релевантных эмоциональным состояниям человека
3.4.1. Определение энергетических, просодических
и форматных параметров
3.4.2. Определение спектральных и временных параметров
3.4.3. Определение кепстральных параметров
3.4.4. Определение параметров на основе нелинейного энергетического оператора Тигера
3.5. Разработка способа классификации эмоциональных состояний
на основе рекуррентной нейронной сети
Выводы по главе
ГЛАВА 4. ИССЛЕДОВАНИЕ МЕТОДОВ ОБРАБОТКИ И АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ ДЛЯ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ КРИТИЧЕСКИХ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА
4.1. Выбор и обоснование программной среды обработки и анализа эмоциональных речевых сигналов
4.2. Исследование метода подавления помех в речевых сигналах
4.3. Исследование метода сегментации речевых сигналов
на информативные участки
4.4. Оптимальный набор информативных параметров речевых сигналов, релевантных эмоциональным состояниям человека
4.5. Исследование метода определения информативных параметров речевых сигналов
4.6. Исследование способа классификации критических эмоциональных состояний
Выводы по главе
ГЛАВА 5. РАЗРАБОТКА СИСТЕМЫ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ КРИТИЧЕСКИХ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ
5.1. Обзор и анализ системы обнаружения и классификации эмоциональных состояний человека по речевым сигналам
5.2. Патентный поиск систем обнаружения и классификации эмоциональных состояний человека по речевым сигналам
5.3. Формирование технических требований к разрабатываемой системе обнаружения и классификации эмоциональных состояний человека
5.4. Выбор и обоснование программных средств реализации системы обнаружения и классификации эмоциональных состояний человека
5.5. Разработка структуры системы обнаружения и классификации критических эмоциональных состояний человека
Выводы по главе
ГЛАВА 6. ПРОГРАММНО-АППАРАТНАЯ РЕАЛИЗАЦИЯ СИСТЕМЫ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ КРИТИЧЕСКИХ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА
В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ
6.1. Программная реализация системы обнаружения и классификации эмоциональных состояний человека по речевым сигналам
6.2. Разработка пользовательского интерфейса мобильного приложения системы обнаружения и классификации эмоциональных состояний человека по речевым сигналам
6.3. Аппаратная реализация функциональных узлов системы обнаружения и классификации эмоциональных состояний
человека по речевым сигналам
6.4. Исследование системы обнаружения и классификации критических эмоциональных состояний человека по речевым
сигналам в экстремальных условиях
Выводы по главе
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А. Листинг информационного обеспечения системы обработки речевых сигналов на основе модификаций ДЭМ
ПРИЛОЖЕНИЕ Б. Листинг информационного обеспечения системы подавления помех
ПРИЛОЖЕНИЕ В. Листинг информационного обеспечения системы сегментации на информативные участки
ПРИЛОЖЕНИЕ Г. Графический интерфейс инструментального обеспечения системы обнаружения и классификации критических эмоциональных состояний человека по речевым сигналам
ПРИЛОЖЕНИЕ Д. Основные параметры баз данных эмоциональной речи, получивших широкую практическую популярность в области распознавания эмоций
ПРИЛОЖЕНИЕ Е. Усредненные данные ошибок первого и второго родов, полученные по результатам сегментации разработанным методом
ПРИЛОЖЕНИЕ Ж. Усредненные данные среднеарифметических значений ошибок первого и второго родов, полученные по результатам сегментации разработанным методом
ПРИЛОЖЕНИЕ З. Документы, подтверждающие использование и внедрение результатов диссертационного исследования
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Способы и системы определения сигнальных маркеров психогенных психических расстройств2019 год, доктор наук Тычков Александр Юрьевич
Методы и алгоритмы повышения эффективности автоматического интонационного анализа речевых сигналов2012 год, кандидат технических наук Марьев, Александр Александрович
Модель, численная и программная реализация оценивания частоты основного тона речевого сигнала с помощью сингулярного спектрального анализа2015 год, кандидат наук Вольф Данияр Александрович
Разработка средств исследования и повышения помехоустойчивости систем автоматического распознавания голосовых команд в телефонии2014 год, доктор наук Левин Евгений Калманович
Разработка и исследование методов и алгоритмов для анализа устной речи с использованием дифонов на основе априорной сегментации2017 год, кандидат наук Ниценко, Артём Владимирович
Введение диссертации (часть автореферата) на тему «Методы обработки речевых сигналов и система обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях»
ВВЕДЕНИЕ
Актуальность темы исследования. Современные социально значимые заболевания (постановление Правительства РФ от 1 декабря 2004 г. № 715) являются одной из главных причин временной утраты трудоспособности населения. Несвоевременная оценка психических расстройств и расстройств поведения является значимой проблемой для каждого государства, поскольку напрямую связана с формированием здорового образа жизни населения и профилактикой сопутствующих заболеваний.
Согласно МКБ-11 психические и поведенческие расстройства приводят к нарушениям нейропсихического развития и, как следствие, к расстройствам, специфически связанным со стрессом (6В4 МКБ-11). По данным «Института показателей оценки здоровья», в России только за 2021 г. более 5 млн человек были подвержены расстройствам, специфически связанным со стрессом (депрессивным и тревожным расстройством). По данным Всемирной организации здравоохранения в 2019 г. в мире тревожными расстройствами страдал 301 млн человек, включая 58 млн детей и подростков, а депрессивными расстройствами - 280 млн человек, включая 23 млн детей и подростков.
Наиболее распространенными признаками депрессивных и тревожных расстройств являются: низкий уровень эмоциональной устойчивости и восприимчивости к стрессовым ситуациям, нарушения аффективных реакций, сопровождающихся повышенной возбудимостью, импульсивностью и низкой способностью к самоконтролю. Обнаружение и классификация эмоционального состояния человека являются значимыми критериями для мониторинга и ранней диагностики психических и поведенческих расстройств.
Различные эмоциональные состояния человека могут проявляться нарушениями выраженности, силы, адекватности и устойчивости к
определенным внешним стимулам в критических ситуациях. Своевременное обнаружение и классификация критических эмоциональных состояний особенно важны для специалистов в экстремальных условиях (авиаавтокатастрофы, землетрясения, наводнения, теракты, военные операции и т.п.), деятельность которых связана с повышенной ответственностью (пилоты, космонавты, сотрудники полиции и специальных служб, военнослужащие, диспетчеры аэропортов и опасных производственных объектов АЭС, ТЭС, объектов химической промышленности и т.п.) и риском возникновения техногенных и биогенных аварий, высокой смертностью и инвалидизацией.
В настоящее время для обнаружения и классификации эмоциональных состояний человека применяется различное методическое, информационное, инструментальное и программное обеспечение, основанное на экспериментально-статистических методах обработки сигналов по доступным каналам регистрации реакций организма человека. Наиболее непринужденным и приспособленным к экстремальным условиям является способ, основанный на анализе речи.
Отечественные ученые М. В. Хитров, К. В. Сидоров, Н. Н. Филатова, Е. Е. Ляксо и зарубежные исследователи W. Björn Schuller, Florian Eyben, Felix Weninger, Anton Batliner, Stefan Steidl достигли значительных успехов в области обнаружения и классификации эмоциональных состояний человека по речевым сигналам. Несмотря на высокую значимость их научных трудов и наличие оригинальных подходов к оценке эмоциональных состояний по речи, до настоящего времени имеется ряд нерешенных проблем:
- отсутствие средств хранения и интерпретации речевых сигналов (баз данных), зарегистрированных в реальных жизненных ситуациях естественного переживания эмоций;
- отсутствие оптимального набора информативно-значимых параметров речевых сигналов, релевантных нарушениям работы органов речевого аппарата
вследствие естественного переживания эмоций человеком в реальных отрицательных, нейтральных и положительных эмоциональных состояниях;
- отсутствие эффективных методов, способов и средств определения информативно-значимых параметров речевых сигналов и классификации критических эмоциональных состояний человека в экстремальных условиях.
Совершенствование и разработка новых методов и средств обработки и анализа речевых сигналов для повышения достоверности обнаружения и классификации критических эмоциональных состояний человека в системах медицинского назначения являются актуальными задачами и соответствуют направлениям Стратегии научно-технологического развития РФ: «Переход к персонализированной медицине, высокотехнологичному здравоохранению и технологиям здоровьесбережения» и «Противодействие техногенным, биогенным, социокультурным угрозам, терроризму и идеологическому экстремизму, а также киберугрозам и иным источникам опасности для общества, экономики и государства». Указанные причины обусловили актуальность темы исследования.
Степень разработанности темы исследования. Современный уровень развития техники обеспечил широкое применение методов цифровой обработки речевых сигналов в медико-биологической практике. Значительный вклад в развитие направления внесен такими учеными, как Р. К. Потапова, Е. Е. Ляксо, А. А. Карпов, И. Б. Тампель, Е. С. Семенкин, М. В. Хитров, К. В. Сидоров, Н. Н. Филатова, А. Ф. Хроматиди, Е. В. Сидорова, Björn W. Schuller, Shrikanth Narayanan, Florian Eyben, Martin Wöllmer, Felix Weninger, Anton Batliner, Stefan Steidl, Erik Marchi, Maja Pantic, Zixing Zhang, Alexandra Balahur-Dobrescu, Maite Taboada и др. Решением вопросов цифровой обработки речевых сигналов занимаются отечественные научные школы Национального исследовательского университета «ИТМО» (г. Санкт-Петербург), Московского государственного университета им. M. В. Ломоносова (г. Москва), Московского физико-технического института (г. Долгопрудный), Рязанского государственного радиотехнического
университета (г. Рязань), Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» им. В. И. Ульянова (Ленина) (г. Санкт-Петербург), Таганрогского государственного радиотехнического университета (г. Таганрог), Пензенского государственного университета (г. Пенза) и др.
Несмотря на значительные успехи развития методов цифровой обработки, существует проблема их эффективной реализации, связанная с нестационарностью исследуемых речевых сигналов и невозможностью описать их четкой аналитической функцией в различных временных, частотных и энергетических представлениях.
Кроме того, на сегодня известны различные системы распознавания моделированных и вынужденных эмоций человека по речевым сигналам. Однако ключевой проблемой является отсутствие достоверных систем обнаружения и классификации критических эмоциональных состояний, ценность которых возрастает в экстремальных условиях, когда деятельность человека сопровождается сложными когнитивными процессами, дефицитом времени и высокой психоэмоциональной нагрузкой.
Целью исследования является создание методического, информационного и программного обеспечения системы обработки и анализа речевых сигналов для повышения достоверности обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях.
Задачи исследования:
1. Уточнение требований к компонентам математической модели, описывающей процесс оригинального представления речевых сигналов с использованием различных модификаций декомпозиции на эмпирические моды (ДЭМ), обеспечивающей расширение пространства значимых характеристик исходной эмоциональной речи для формирования оптимального набора параметров, релевантных критически выраженным эмоциональным состояниям человека.
2. Разработка информационного обеспечения средства хранения и интерпретации данных эмоциональной речи на русском языке (зарегистрировано при естественном переживании эмоций человеком в реальных отрицательных, нейтральных и положительных жизненных обстоятельствах), предназначено для оценки достоверности результатов обработки и анализа речевых сигналов, обучения и тестирования системы обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях.
3. Разработка и исследование компонент методического и программного обеспечения системы для подавления интенсивных помех в речевых сигналах и повышения эффективности анализа эмоциональной речи в агрессивной шумовой обстановке в экстремальных условиях.
4. Разработка и исследование компонент методического и программного обеспечения системы для сегментации на информативные вокализованные, невокализованные участки и участки пауз и повышения эффективности анализа эмоциональной речи при нестабильной моторике органов речевого аппарата человека в экстремальных условиях.
5. Разработка и исследование компонент методического и программного обеспечения системы для определения информативно-значимых параметров на основе энергетического, просодического, формантного, спектрального, временного, кепстрального анализов и анализа нелинейного энергетического оператора Тигера (Teager Energy Operator, TEO) характеристик эмоциональных речевых сигналов и формирования оптимального набора амплитудно-частотных, спектрально-временных, кепстральных параметров, релевантных критическим эмоциональным состояниям человека в экстремальных условиях.
6. Разработка и исследование компонент методического и программного обеспечения системы для распознавания на основе нейросетевого анализа и повышения достоверности обнаружения и
классификации отрицательных, нейтральных и положительных эмоциональных состояний человека в экстремальных условиях.
7. Разработка и экспериментальное исследование программно-аппаратной реализации системы обнаружения и классификации критических отрицательных (страх, отвращение, гнев, печаль, удивление), нейтральных (нейтралитет) и положительных (удивление, радость) эмоциональных состояний человека по речевым сигналам в экстремальных условиях.
Методы исследования. Использованы современные математические методы цифровой обработки речевых сигналов (преобразование Фурье (ПФ), преобразование Гильберта - Хуанга (ПГХ), модификации ДЭМ). Для реализации системы использовались среды программирования и разработки MATLAB, Qt и Python.
Объектом исследования являются системы обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях.
Предмет исследования - компоненты методического, информационного и программного обеспечения системы.
Научная новизна:
1. Усовершенствована математическая модель представления речевых сигналов для повышения достоверности обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях, отличающаяся наличием этапов фрагментирования, декомпозиции и объединения эмпирических мод (ЭМ) в новые модовые сигналы для расширения пространства информативно-значимых параметров исходной эмоциональной речи (соответствует п. 14 паспорта специальности 2.2.12).
2. Разработано информационное средство хранения речевых данных, отличающееся новым подходом интерпретации эмоциональной речи на русском языке с учетом характера выражения эмоций, вида профессиональной деятельности человека при естественном переживании эмоций в реальных отрицательных, нейтральных и положительных
эмоциональных состояниях (соответствует п. 10 паспорта специальности 2.2.12).
3. Разработан новый метод подавления помех в эмоциональной речи, обеспечивающий фильтрацию шумов в широком динамическом диапазоне с минимальным уровнем остаточного шума, отличающийся наличием этапов фрагментирования, формирования комбинированных сигналов и анализа остаточного шума (соответствует п. 14 паспорта специальности 2.2.12).
4. Предложен оригинальный метод сегментации эмоциональной речи на информативные участки, обеспечивающий повышение достоверности обнаружения границ начала и окончания вокализованных, невокализованных участков и участков пауз, отличающийся наличием этапов фрагментирования, пороговой обработки и исправления ошибок сегментации (соответствует п. 14 паспорта специальности 2.2.12).
5. Разработан метод определения информативных параметров эмоциональной речи человека в экстремальных условиях, обеспечивающий обнаружение амплитудно-частотных, спектрально-временных, кепстральных параметров и параметров на основе ТЕО, релевантных естественным критическим эмоциональным состояниям человека, отличающийся наличием этапов фрагментирования и формирования набора новых информативных речевых сигналов (соответствует пп. 14, 16 паспорта специальности 2.2.12).
6. Усовершенствован способ классификации отрицательных, нейтральных и положительных естественных эмоциональных состояний человека, отличающийся применением различных функций активации нейронов на каждом слое рекуррентной нейронной сети (соответствует п. 10 паспорта специальности 2.2.12).
7. Разработана структура и реализована система определения критических эмоциональных состояний человека в экстремальных условиях по речевым сигналам, обеспечивающая высокую достоверность, пропускную способность и производительность в реальном времени, новизна которой
обусловлена оригинальной кластерной реализацией клиентских и серверных средств (соответствует пп. 10, 16 паспорта специальности 2.2.12).
Теоретическая и практическая значимость работы:
1. Математическая модель представления речевых сигналов на основе оригинального применения ДЭМ, множественной ДЭМ (МДЭМ) и улучшенной полной МДЭМ с адаптивным шумом (ПМДЭМАШ) используется для создания методологического обеспечения практических решений в области обработки и анализа эмоциональной речи, обеспечивающая расширение пространства информативно-значимых параметров в 256 раз.
2. База данных, содержащая речевые сигналы на русском языке, зарегистрированная при естественном переживании эмоций человеком в реальных отрицательных, нейтральных и положительных состояниях, используется для информационного обеспечения средств хранения и интерпретации критических эмоциональных состояний в экстремальных условиях.
3. Метод и программа подавления помех в речевых сигналах, зашумленных белым, розовым и коричневым шумами в условиях агрессивной шумовой обстановки (отношение сигнал/шум (ОСШ) от минус 5 до 5 дБ), использованы для регистрации специализированными носимыми видеорегистраторами речи и звука окружающей обстановки во время исполнения служебных обязанностей сотрудниками безопасности и полиции (ООО «ДМТ», г. Москва).
4. Метод и программа обнаружения начала и окончания границ информативных вокализованных, невокализованных участков и участков пауз с высокой достоверностью (ошибки первого (а) и второго (в) родов -не более 5 %) использованы для определения голосовой активности:
- в каналах передачи речевых данных телекоммуникационного оборудования мобильной связи (ООО «Т2 Мобайл», г. Пенза);
- в каналах передачи речевых данных авиационной аппаратуры внутренней связи и оповещения, систем развлечения пассажиров, аппаратуры связи и коммутации (АО ДНИИ «Волна», г. Дербент, Республика Дагестан).
5. Метод и программа определения 40 информативно-значимых амплитудно-частотных, спектрально-временных, кепстральных параметров и параметров на основе ТЕО речевых сигналов с высоким уровнем релевантности естественным эмоциональным состояниям человека использованы при анализе тембра голоса пациентов до и после операций на щитовидной железе (или органах шеи) в условиях нестабильной моторики органов речевого аппарата (ГБУЗ «Пензенская областная клиническая больница им. Н. Н. Бурденко», г. Пенза).
6. Способ и программа классификации критических эмоциональных состояний человека, обеспечивающие высокую достоверность (а и в - не более 5 %), использованы для определения неспецифических паттернов эмоциональных расстройств, связанных со стрессом (ООО «Лечебно-диагностический центр «Губернский доктор», г. Заречный).
7. Опытный образец системы обнаружения и классификации критических эмоциональных состояний человека в экстремальных условиях, обеспечивающий высокую достоверность (а и в - не более 10 %) в виде клиент-серверного решения:
- использован для оценки состояния испытуемых в условиях виртуальной реальности, повышения точности отклика обратной связи и качества создаваемых виртуальных сцен для коррекции тревожно-фобических расстройств (ООО «Центр Экспозиционной Медицины», г. Пенза);
- интегрирован в разрабатываемые системы комплексной безопасности объектов массовых мероприятий, критической инфраструктуры (АО «НАУЧНО-ТЕХНИЧЕСКИЙ ЦЕНТР «АТЛАС», г. Москва).
Положения, выносимые на защиту:
1. Математическая модель представления речевых сигналов на основе применения модификаций ДЭМ, обеспечивающая расширение пространства информативно-значимых параметров в 256 раз посредством формирования набора новых модовых речевых сигналов.
2. Средство хранения и интерпретации речевых данных, содержащее 1560 звуковых записей (слов, фраз и предложений) естественной эмоциональной речи, зарегистрированной в экстремальных условиях и при переживании эмоций человеком в критических отрицательных, нейтральных и положительных эмоциональных состояниях.
3. Метод подавления помех, обеспечивающий наилучшую фильтрацию в эмоциональных речевых сигналах (в условиях шумовой обстановки с входным ОСШ от минус 5 до 15 дБ), зашумленных белым (в среднем понижение остаточного шума на 2,2 дБ), розовым (в среднем - на 2,3 дБ) и коричневым (в среднем - на 2,4 дБ) шумами.
4. Метод сегментации эмоциональных речевых сигналов, обеспечивающий наилучшее обнаружение начала и окончания границ участков речи и пауз (а = 2,3 %, в = 1,8 %), и участков вокализованной и невокализованной речи (а = 1,6 %, в = 3,0 %).
5. Метод определения информативно-значимых параметров речевых сигналов, обеспечивающий высокий уровень релевантности отрицательным и положительным естественным эмоциональным состояниям человека (минимальное и максимальное фиксируемое изменение значений параметров относительно условного образцового нейтрального состояния: уменьшение на 18 % и увеличение на 40 % соответственно).
6. Способ классификации на основе пятислойной рекуррентной нейронной сети с применением различных функций активации нейронов на каждом слое сети, обеспечивающий классификацию критических эмоциональных состояний и эмоций в экстремальных условиях с достоверностью от 91,9 до 95,6 %.
7. Система, состоящая из модулей обработки, классификации и управления, обеспечивающая обнаружение и классификацию в реальном времени не более чем за 30 с (при длительности анализируемой записи -не более 60 с) с достоверностью от 94,7 до 95,6 % для эмоциональных состояний (отрицательных, нейтральных и положительных) и от 93,1 до 95,6 % для эмоций (отвращение, страх, гнев, печаль, удивление, нейтралитет и радость).
Результаты диссертационного исследования использованы и
внедрены в виде:
Объект внедрения
1. Способы и программы обработки речевых сигналов, зарегистрированных в условиях нестабильной моторики органов речевого аппарата
2. Способы и программы обработки речевых сигналов для практического применения врачами функциональной диагностики
3. Опытный образец системы обнаружения и классификации критических эмоциональных состояний человека
4. Способы сегментации речевых сигналов для повышения точности идентификации голосовой активности в каналах передачи авиационной аппаратуры
5. Программные средства обнаружения и классификации эмоциональных состояний человека для систем комплексной безопасности массовых мероприятий и критической инфраструктуры
6. Способы и программы предварительной фильтрации слитного потока речи для повышения оперативности обработки сигналов телекоммуникационного оборудования
7. Методы предварительной обработки, анализа и фильтрации речевых сигналов для использования в носимых видеорегистраторах
Организация ГБУЗ «Пензенская областная
клиническая больница им. Н. Н. Бурденко»
ООО «Лечебно-диагностический центр «Губернский доктор»
ООО «Центр
Экспозиционной
Медицины»
АО ДНИИ «Волна»
АО «НАУЧНО-ТЕХНИЧЕСКИЙ ЦЕНТР «АТЛАС»
ООО «Т2 Мобайл»
ООО «ДМТ»
Адрес 440026, Пензенская область, г. Пенза, ул. Лермонтова, д. 28
442960, Пензенская область, г. Заречный, пр-т Мира, д. 82 а 440047, Пензенская область, г. Пенза, ул. Кронштадтская, д. 2, кв. 159 368608, Республика Дагестан, г. Дербент, ул. Строительная, д. 3
127018, г. Москва, ул. Образцова, 38
440000, Пензенская область, г. Пенза, ул. Революционная, д. 71
121205, г. Москва, территория Сколково Инновационного Центра, ул. Нобеля, д. 7, пом. V, ком. 14
Объект внедрения 8. Теоретические и практические результаты при подготовке студентов по направлениям подготовки 12.03.01, 12.04.01 «Приборостроение» и специальностям 11.05.01 «Радиоэлектронные системы и комплексы», 31.05.01 «Лечебное дело», 30.05.03 «Медицинская кибернетика»;
магистрантов, аспирантов и научных работников
Степень достоверности и апробация результатов. Обоснованность и достоверность положений, выносимых на защиту, подтверждаются тем, что в теоретических построениях диссертационной работы использовались законы и положения, справедливость которых общепризнанна, полученным результатам не противоречат исследования других ученых.
Все теоретические и практические результаты, основанные на разработанных методах обработки и анализа речевых сигналов и системе обнаружения и классификации естественных эмоциональных состояний человека, выполнены непосредственно автором или под его руководством. Автору принадлежат содержащиеся в диссертационной работе исследования усовершенствованной математической модели представления речевых сигналов на основе модификаций ДЭМ, ее практическое применение в решении задач фильтрации и подавления помех, сегментации на информативные участки и определения информативных параметров речевых сигналов. Единолично опубликовано 16 научных статей в изданиях, рекомендованных ВАК РФ, и 3 статьи в журнале, индексируемом международными базами данных Scopus и Web of Science. Автор обладает опытом руководства тремя научными проектами (НИР и ОКР) и в двух принимал участие в качестве ответственного исполнителя:
1. «Исследование информативных параметров речевых сигналов и разработка алгоритмов обнаружения скрытых признаков
Организация ФГБОУ ВО «Пензенский государственный университет»
Адрес 440026, Пензенская область, г. Пенза, ул. Красная, 40
психоэмоционального состояния операторов критичных по безопасности систем управления», 2018-2019 гг., РФФИ, 18-37-00256 мол_а.
2. «Исследование информативно-значимых параметров речевых сигналов: поиск уникально новых признаков естественно выраженных эмоций для повышения точности оценки психоэмоционального состояния операторов систем управления с высокой степенью ответственности», 20182020 гг., Совет по грантам Президента РФ, № СП-246.2018.5.
3. «Разработка методологии исследования влияния психотравмирующих факторов на речевую функцию человека в условиях реальных экстремальных ситуаций», 2020-2021 гг., Совет по грантам Президента РФ, № МК-490.2020.8.
4. «Поиск скрытых паттернов пограничных психических расстройств и разработка системы экспресс-оценки состояния психического здоровья человека», 2017-2019 гг., РНФ, № 17-71-20029.
5. «Разработка способов и виртуальных средств адаптивной помехозащищенной обработки и обнаружения клинически значимых параметров медицинских электрических и акустических сигналов у пациентов с пограничными психическими расстройствами», 2017-2018 гг., Совет по грантам Президента РФ, № МК-250.2017.8.
Апробация работы. Основные положения работы докладывались и обсуждались на международных науч.-техн. конференциях: «Методы, средства и технологии получения и обработки измерительной информации» («Шляндинские чтения») (г. Пенза, 2016-2022 гг.); «International Conference on Digital Signal Processing and its Applications» (DSPA) (г. Москва, 20212023 гг.); МНТК «Dynamics of Complex Networks and their Applications» (DCNA) (г. Калининград, 2021, 2022 гг.); «IEEE Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology» (USBEREIT) (г. Екатеринбург, 2018, 2021, 2022 гг.); «Перспективные информационные технологии», (г. Самара, 2012-2022 гг.); «IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering» (EIConRus)
(г. Санкт-Петербург, 2019-2021 гг.); «IEEE Siberian Conference on Control and Communications» (SIBCON) (г. Омск, 2015 г.; г. Москва, 2016 г.; г. Томск, 2019 г.; г. Казань, 2021 г.); МНТК «Проблемы автоматизации и управления в технических системах» (ПАУТС) (г. Пенза, 2017, 2019, 2021 гг.); «International Conference «Engineering & Telecommunication» (En&T) (г. Москва, 2015-2018 гг.); «International Russian Automation Conference» (RusAutoCon) (г. Сочи, 2018, 2020 гг.); «Finnish-Russian University Cooperation in Telecommunications» (FRUCT) (г. Хельсинки, 2017, 2018 гг.) и др.
Публикации. По материалам диссертации опубликовано 168 печатных трудов, из них 42 статьи - в журналах, рекомендованных ВАК РФ, 57 статей -в журналах, индексируемых базами данных Scopus и Web of Science, 2 патента на изобретения, 25 свидетельств о государственной регистрации программ для ЭВМ и баз данных. В автореферате приведено 50 наиболее существенных публикаций.
Структура и объем диссертации. Диссертационная работа состоит из введения, 6 глав, выводов, библиографического списка из 397 наименований и 8 приложений. Общий объем работы - 398 страниц, включая 68 рисунков, 40 таблиц.
ГЛАВА 1. СПЕЦИФИКА И ПРОБЛЕМЫ ОБНАРУЖЕНИЯ
И КЛАССИФИКАЦИИ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ
1.1. Проблемы обнаружения и классификации эмоциональных состояний человека
1.1.1. Актуальность обнаружения и классификации
эмоциональных состояний человека в экстремальных условиях
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Разработка критериев и алгоритмов сегментации речевого сигнала на участки "ТОН/НЕ ТОН" для метода выделения основного тона в информационно-измерительных системах речевой технологии2000 год, кандидат технических наук Архипов, Игорь Олегович
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Модели и алгоритмы в системах анализа речевых сигналов2013 год, кандидат технических наук Трубицын, Владимир Геннадьевич
Модель и алгоритмы анализа и сегментации речевого сигнала2007 год, кандидат технических наук Конев, Антон Александрович
Система электрокардиографической диагностики критических состояний в условиях свободной активности пациента2017 год, кандидат наук Кривоногов, Леонид Юрьевич
Список литературы диссертационного исследования доктор наук Алимурадов Алан Казанферович, 2023 год
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Соколов, Г.А. Оптимизация психоэмоционального состояния студентов в период сессии / Г.А. Соколов // Психолог. - 2015. - № 1. -С. 28 - 43.
2. Institute of Health Metrics and Evaluation. Global Health Data Exchange (GHDx) [Электронный ресурс]. - URL: https://vizhub.healthdata.org/gbd-results/ (дата обращения: 20.02.2023).
3. World Health Organization [Электронный ресурс]. - URL: https://www.who.int/ (дата обращения: 20.02.2023).
4. Mental Health and COVID-19: Early evidence of the pandemic's impact. Geneva: World Health Organization [Электронный ресурс]. - URL: https://www.who.int/publications/i/item/WH0-2019-nCoV-Sci_Brief-Mental_health-2022.1 (дата обращения: 20.02.2023).
5. Depression and Other Common Mental Disorders: Global Health Estimates. Geneva: World Health Organization [Электронный ресурс]. - URL: https://apps.who.int/iris/handle/10665/254610 (дата обращения: 20.02.2023).
6. В Минздраве заявили о депрессии и тревоге у 99 % переболевших COVID-19 [Электронный ресурс]. - URL: https://www.rbc.ru/society/25/03/2021/605c8d6f9a7947472c8442b2 (дата обращения: 20.02.2023).
7. Здравоохранение в России. 2021 : статистический сборник / Росстат. - Москва, 2021. - 171 с.
8. Kleinginna, P.R. A categorized list of emotion definitions, with suggestions for a consensual definition / P.R. Kleinginna, A.M. Kleinginna // Motivation Emotion. - 1981. - № 5 (4). - P. 345 - 379.
9. Schubiger, M. English intonation: its form and function / M. Schubiger. -California, USA : Walter de Gruyter, 1958. - 112 p.
10. O'Connor, J.D. Intonation of Colloquial English / J.D. O'Connor, G.F. Arnold. - London : Longman, 1973. - 290 p.
11. Бурлачук, Л.Ф. Психотерапия. Психологические модели / Л.Ф. Бурлачук, А.С. Кочарян, М.Е. Жидко. Учебник для вузов. - 3-е изд. допол., стереотип. - Санкт-Петербург : Питер, 2012. - 496 с.
12. Лопес, Е.Г. Основы психотерапии : практ. ориентир. пособие / Е.Г. Лопес, О.А. Рудей. - Екатеринбург : Изд-во ГОУ ВПО «Рос. гос. проф.-пед. ун-т», 2006. - 103 с.
13. Бобков, А.С. Модели и методы определения эмоционального состояния человека на основе автоматизированной обработки и анализа видеоинформации : диссертация на соискание ученой степени кандидата технических наук : 05.13.01 / Бобков А.С. ; Институт системного анализа РАН. - Москва, 2013. - 170 с.
14. Кислова, О.О. Психофизиологические предпосылки успешности распознавания эмоциональной речевой экспрессии : диссертация на соискание ученой степени кандидата технических наук : 03.00.13 / Кислова О.О. ; Институт высшей нервной деятельности и нейрофизиологии РАН. -Москва, 2009. - 151 с.
15. Farwell, L.A. Brain fingerprinting: a comprehensive tutorial review of detection of concealed information with event-related brain potentials / L.A. Farwell // Cogn Neurodyn. - 2012. - № 6 (2). - P. 115-154.
16. Louren5o, A. ECG in Biometric Recognition: Time Dependency and Application Challenges / A. Louren5o, H. Silva, A. Fred // IEEE International Workshop on Machine Learning for Signal Processing. - 2012. - № 10. -P. 42-52.
17. Kappeler-Setz. C. Towards long term monitoring of electrodermal activity in daily life / C. Kappeler-Setz, F. Gravenhorst, J. Schümm, B. Arnrich, G. Tröster // Journal Personal and Ubiquitous Computing London. - 2013. -№ 17. - P. 261-271.
18. Likforman-Sulem, L. EMOTHAW: A Novel Database for Emotional State Recognition From Handwriting and Drawing / L. Likforman-Sulem,
A. Esposito, M. Faundez-Zanuy, S. Clemen5on, G. Cordasco // IEEE Transactions on Human-Machine Systems. - 2017. - № 47 (2). - P. 273 - 284.
19. Quan, C. Emotion analysis in blogs at sentence level using a Chinese emotion corpus / C. Quan, T. He, F. Ren // 6th International Conference on Natural Language Processing and Knowledge Engineering (NLPKE-2010) (Beijing, 21-23 August 2010). - Beijing, China : IEEE, 2010. - P. 105-117.
20. Барабанщиков, В.А. Методы регистрации движений глаз в психологии: основы учебно-методического комплекса / В.А. Барабанщиков,
A.В. Жегалло // Экспериментальная психология. - 2014. - Т. 7, № 1. -С.132-137.
21. Заболеева-Зотова, А.В. Задача создания системы автоматизированного распознавания эмоций / А.В. Заболеева-Зотова, Ю.А. Орлова, В.Л. Розалиев, А.С. Бобков // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (0STIS-2012) : материалы II Междунар. научн.-техн. конф. (Минск, 16-18 февраля 2012 г.) / ред. кол.: В.В. Голенков (отв. ред.) [и др.]. - Минск : БГУИР, 2012. - C. 347-350.
22. Волков, В.Г. Тепловизионные приборы нового поколения /
B.Г. Волков, А.В. Ковалев, В.Г. Федчишин // Специальная Техника. - 2001. -№ 6. - С. 19-23.
23. Loughland, C.M. Visual scanpaths to positive and negative facial emotions in an outpatient schizophrenia sample / C.M. Loughland, L.M. Williams, E. Gordon // Schizophr Res. - 2002. - № 55 (1-2). - P. 159-170.
24. Schuller, B.W. Computational Paralinguistics: Emotion, Affect and Personality in Speech and Language Processing / B.W. Schuller, A.M. Batliner. -New York : Wiley, 2013. - 344 p.
25. Давыдов, А.Г. Выбор оптимального набора информативных признаков для классификации эмоционального состояния диктора по голосу / А.Г. Давыдов, В.В. Киселёв, Д.С. Кочетков, А.В. Ткаченя // Компьютерная лингвистика и интеллектуальные технологии : по материалам ежегодной
Международной конференции «Диалог» (Бекасово, 30 мая - 3 июня 2012 г.). - Вып. 11 (18) : в 2 т. Т. 1: Основная программа конференции. - Москва : Изд-во РГГУ, 2012. - С. 122-128.
26. Williamson, J.R Vocal and facial biomarkers of depression based on motor incoordination and timing / J.R Williamson, T.F Quatieri, B.S Helfer, G. Ciccarelli, D.D. Mehta // 4th International Workshop on Audio/Visual Emotion Challenge (Orlando, 7 November 2014). - New York : Association for Computing Machinery, 2014. - P. 65-74.
27. Schuller, B. Speech emotion recognition combining acoustic features and linguistic information in a hybrid support vector machine-belief network architecture / B. Schuller, G. Rigoll, M. Lang // IEEE International Conference on Acoustics, Speech, and Signal Processing (Montreal, 17-21 May 2004). -Montreal, QC, Canada : IEEE, 2004. - P. 577-580.
28. Hansen, John H.L. ICARUS: source generator based real-time recognition of speech in noisy stressful and Lombard effect environments / John H.L. Hansen, D.A. Cairns // Speech Communication. - 1995. - № 16 (4). -P. 391-422.
29. Ma, J. Ubiquitous Intelligence and Computing: Third International Conference, UIC 2006, Wuhan, China, September 3-6, 2006, Proceedings (Lecture Notes in Computer Science) / J. Ma, H. Jin, L. Yang, J. Tsai. - New York, USA : Springer-Verlag Inc., 2006. - 1212 p.
30. Cowie, R. Emotion recognition in human-computer interaction / R. Cowie, E. Douglas-Cowie, N. Tsapatsoulis, S. Kollias, W. Fellenz, J. Taylor // IEEE Signal Processing Magazine. - 2001. - № 1 (18). - P. 32-80.
31. Hozjan, V. Context-independent multilingual emotion recognition from speech signal / V. Hozjan, Z. Kacic // International Journal of Speech Technology. - 2003. - № 6. - P. 311-320.
32. Fernandez, R. A computational model for the automatic recognition of affect in speech / R. Fernandez, R.W. Picard. - Massachusetts Ave, Cambridge, MA : Massachusetts Institute of Technology, 2004. - 284 p.
33. Williams, C. Vocal correlates of emotional states / C. Williams, K. Stevens // Speech Evaluation in Psychiatry. - 1981. - № 7. - P. 189-220.
34. Cahn, J.E. The generation of affect in synthesized speech / J.E. Cahn // Output Soc. - 1990. - № 4. - P. 1-19.
35. Liscombe, J.J. Prosody and speaker state: paralinguistics, pragmatics, and proficiency / J.J Liscombe. - New York : Columbia University, 2007. - 232 p.
36. Banse, R. Acoustic profiles in vocal emotion expression / R. Banse, K.R. Scherer // Journal of Personality and Social Psychology. - 1996. - № 70 (3). -P. 614-636.
37. Martínez-Arroyo, M. Emotional Corpus, Feature Extraction and Emotion Classification Using the Parameterized Voice Signal / M. Martínez-Arroyo, V. Bello-Ambario, J.A. Montero-Valverde, E.D.L. Cruz-Gámez, M. Hernández-Hernández, J.L. Hernández-Hernández // Communications in Computer and Information Science (CCIS), Technologies and Innovation, 7th International Conference, CITI 2021. - 2021. - № 1460. - P. 51-64.
38. France, D.J. Acoustical properties of speech as indicators of depression and suicidal risk / D.J. France, R.G. Shiavi, S. Silverman, M. Silverman, M. Wilkes // IEEE Transactions on Biomedical Engineering (July 2000). - 2000. -№ 7 (47). - P. 829-837.
39. Nicholson, J. Emotion recognition in speech using neural networks / J. Nicholson, K. Takahashi, R. Nakatsu // Neural Computing and Applications. -2000. - № 9. - P. 290-296.
40. Koelstra, S. A dynamic texture-based approach to recognition of facial actions and their temporal models / S. Koelstra, M. Pantic, I. Patras // IEEE transactions on pattern analysis and machine intelligence. - 2010. - № 32 (11). -P. 1940-1954.
41. Фант, Г.К. Акустическая теория речеобразования / Г.К. Фант ; пер. с анг. Л.А. Варшавского и В.И. Медведева ; науч. ред. В.С. Григорьева. -Москва : Наука, 1964. - 284 с.
42. Леонтьев, А.А. Психофизиологические механизмы речи. - Москва : Наука, 1970. - 370 с.
43. Айзман, Р.И. Физиология человека : учебное пособие. / Р.И. Айзман, И.П. Абаскалова, Н.С. Шуленина. - 2-е издание дополненное и переработанное. - Москва : ИНФРА-М, 2015. - 432 с.
44. Ноздрачев, А.Д. Общий курс физиологии человека и животных : в 2 книгах. Книга 1. Физиология нервной, мышечной и сенсорной систем : учебник для биол. и медиц. спец. вузов / А. Д. Ноздрачев, И. А. Баранникова, А. С. Батуев [и др.] ; под ред. А.Д. Ноздрачева. - Москва : Высшая школа, 1991. - 512 с.
45. Рабинер, Л.Р. Цифровая обработка речевых сигналов : пер. с англ. / Л.Р. Рабинер, Р.В. Шафер. - Москва : Радио и связь, 1981. - 496 с.
46. Ververidis, D. Emotional speech classification using Gaussian mixture models and the sequential floating forward selection algorithm / D. Ververidis, C. Kotropoulos // 2005 IEEE International Conference on Multimedia and Expo (Amsterdam, 6 July 2005). - Amsterdam, Netherlands : IEEE, 2005. - P. 1500-1503.
47. Hu, H. Fusion of global statistical and segmental spectral features for speech emotion recognition / H. Hu, M.-X. Xu, W. Wu // International Speech Communication Association. 8th Annual Conference of the International Speech Communication Association (Antwerp, 27-31August 2007). - Antwerp, Belgium : DBLP, 2007. - P. 1013-1016.
48. Shami, M.T. Segment-based approach to the recognition of emotions in speech / M.T. Shami, M.S. Kamel // 2005 IEEE International Conference on Multimedia and Expo (Amsterdam, 6 July 2005). - Amsterdam, Netherlands : IEEE, 2005. - 4 p.
49. Picard, R.W. Toward machine emotional intelligence: analysis of affective physiological state / R.W. Picard, E. Vyzas, J. Healey // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2001. - № 10 (23). -P. 1175-1191.
50. Nwe, T. Speech emotion recognition using hidden Markov models / T. Nwe, S. Foo, L. De Silva // Speech Communication (November 2003). -2003. - № 41 (4). - P. 603-623.
51. Lee, C. Emotion recognition based on phoneme classes / C. Lee, S. Yildrim, M. Bulut, A. Kazemzadeh, C. Busso, Z. Deng, S. Lee, S. Narayanan // INTERSPEECH 2004 - ICSLP, 8th International Conference on Spoken Language Processing (Jeju Island, 4-8 October 2004). - Jeju Island, Korea : DBLP, 2004. -P. 2193-2196.
52. Leinonen, L. Expression of emotional-motivational connotations with a one-word utterance / L. Leinonen, T. Hiltunen // Journal of the Acoustical Society of America. - 1997. - № 102 (3). - P. 1853-1863.
53. Cowie, R. Emotion recognition in human-computer interaction / R. Cowie, E. Douglas-Cowie, N. Tsapatsoulis, S. Kollias, W. Fellenz, J. Taylor // IEEE Signal Processing Magazine. - 2001. - № 1 (18). - P. 32-80.
54. Busso, C. Analysis of emotionally salient aspects of fundamental frequency for emotion detection / C. Busso, S. Lee, S. Narayanan // IEEE Transactions on Audio Speech and Language Processing. - 2009. - № 4 (17). -P. 582-596.
55. Bosch, L. Emotions, speech and the ASR framework / L. Bosch // Speech Communication. - 2003. - № 40 (1-2). - P. 213-225.
56. Johnstone, T. Vocal Communication of Emotion / T. Johnstone, K.R. Scherer. Second ed. - New York : Guilford, 2000. - P. 226-235.
57. Cowie, R. Describing the emotional states that are expressed in speech / R. Cowie, R.R. Cornelius // Speech Communication. - 2003. - № 40 (1-2). -P. 5-32.
58. Murray, I. Toward a simulation of emotions in synthetic speech: A review of the literature on human vocal emotion / I. Murray, J. Arnott // Journal of the Acoustical Society of America. - 1993. - № 93 (2). - P. 1097-1108.
59. Lee, C. Toward detecting emotions in spoken dialogs / C. Lee, S. Narayanan // IEEE Transactions on Speech and Audio Processing. - 2005. -№ 13 (2). - P. 293-303.
60. Cowie, R. Automatic statistical analysis of the signal and prosodic signs of emotion in speech / R. Cowie, E. Douglas-Cowie // The Fourth International Conference on Spoken Language Processing (ICSLP '96) (Philadelphia, 3-6 October 1996). - Philadelphia, PA, USA : IEEE, 1996. - P. 1989-1992.
61. Oster, A. The identification of the mood of a speaker by hearing impaired listeners / A. Oster, A. Risberg // Speech Transmission Lab. Quarterly Progress Status (STL-QPSR). - 1986. - № 27 (4). - P. 79-90.
62. Beeke, S. Prosody as a compensatory strategy in the conversations of people with agrammatism / S. Beeke, R. Wilkinson, J. Maxim // Clinical Linguistics & Phonetics. - 2009. - № 23 (2). - P. 133-155.
63. Borchert, M. Emotions in speech - experiments with prosody and quality features in speech for use in categorical and dimensional emotion recognition environments / M. Borchert, A. Dusterhoft // 2005 International Conference on Natural Language Processing and Knowledge Engineering (Wuhan, 30 October -01 November 2005). - Wuhan, China : IEEE, 2005. - P. 147-151.
64. Tao, J. Prosody conversion from neutral speech to emotional speech / J. Tao, Y. Kang, A. Li // IEEE Transactions on Audio, Speech, and Language Processing. - 2006. - № 4 (14). - P. 1145-1154.
65. Kaiser, L. Communication of affects by single vowels / L. Kaiser // Synthese. - 1962. - № 14. - P. 300-319.
66. Hernando, J. Linear prediction of the one-sided autocorrelation sequence for noisy speech recognition / J. Hernando, C. Nadeu // IEEE Transactions on Speech and Audio Processing. - 1997. - № 1 (5). - P. 80-84.
67. Le Bouquin, R. Enhancement of noisy speech signals: application to mobile radio communications / R. Le Bouquin // Speech Communication. -1996. - № 18 (1). - P. 3-19.
68. Bou-Ghazale, S.E. A comparative study of traditional and newly proposed features for recognition of speech under stress / S.E. Bou-Ghazale, J.H.L. Hansen // IEEE Transactions on Speech and Audio Processing. - 2000. -№ 4 (8). - P. 429-442.
69. Rabiner, L.R. Fundamentals of Speech Recognition / L.R. Rabiner, B.H. Juang. - London : Prentice Hall. - 1993. - 496 p.
70. Deller, J. Discrete Time Processing of Speech Signal / J. Deller, J. Proakis, J. Hansen. - Wiley-IEEE Press IEEE, 1999. - 936 p.
71. Atal, B.S. Effectiveness of linear prediction characteristics of the speech wave for automatic speaker identification and verification / B.S. Atal // The Journal of the Acoustical. - 1974. - № 55 (6). - P. 1304-1312.
72. Scherer, K.R. Vocal affect expression: A review and a model for future research / K.R. Scherer // Psychological Bulletin. - 1986. - № 99 (2). -P. 143-165.
73. Davitz, J.R. The Communication of Emotional Meaning / J.R. Davitz. -First Edition. - New York : McGraw Hill Education, 1964. - 214 p.
74. Gobl, C. The role of voice quality in communicating emotion, mood and attitude / C. Gobl, A.N. Chasaide // Speech Communication. - 2003. - № 40 (1-2). - P.189-212.
75. Schlosberg, H. Three dimensions of emotion / H. Schlosberg // Psychological Review. - 1954. - № 61 (2). - P. 81-88.
76. Li, X. Stress and emotion classification using jitter and shimmer features / X. Li, J. Tao, M.T. Johnson, J. Soltis, A. Savage, K.M. Leong, J.D. Newman // IEEE International Conference on Acoustics, Speech and Signal Processing (Honolulu, 15-20 April 2007). - Honolulu, HI, USA : IEEE, 2007. -P. IV-1081-IV-1084.
77. Gelfer, M.P. Comparisons of jitter, shimmer, and signal-to-noise ratio from directly digitized versus taped voice samples / M.P. Gelfer, D.M. Fendel // Journal of Voice. - 1995. - № 9 (4). - P. 378-382.
78. Teager, H. Evidence for nonlinear production mechanisms in the vocal tract / H. Teager, S. Teager // Speech Production and Speech Modelling, Nato Advanced Institute. - 1990. - № 55. - P. 241-261.
79. Teager, H. Some observations on oral air flow during phonation / H. Teager // IEEE Transactions on Acoustics, Speech, and Signal Processing. -1980. - № 5 (28). - P. 599-601.
80. Kaiser, J.F. On a simple algorithm to calculate the 'energy' of the signal / J.F. Kaiser // International Conference on Acoustics, Speech, and Signal Processing (Albuquerque, 3-6 April 1990). - Albuquerque, NM, USA : IEEE, 1990. - P. 381-384.
81. Caims, D. Nonlinear analysis and detection of speech under stressed conditions / D. Caims, J. Hansen // Journal of the Acoustical Society of America. -1994. - № 96. - P. 3392-3400.
82. Zhou, G. Nonlinear feature based classification of speech under stress / G. Zhou, J. Hansen, J. Kaiser // IEEE Transactions on Speech and Audio Processing. - 2001. - № 3 (9). - P. 201-216.
83. Кучерявый, А.А. Бортовые информационные системы : курс лекций / А.А. Кучерявый ; под. ред. В. А. Мишина и Г.И. Клюева. - 2-е издание, переработанное и дополненное. - Ульяновск : УлГТУ, 2004. - 504 с.
84. Тэйлор, Р. Шум / пер. с англ. Д.И. Арнольда. - Москва : Мир, 1978. - 308 с.
85. Клетт, Д.Х. Методы автоматического распознавания речи : в 2 книгах : пер. с англ. / Д.Х. Клетт, Дж.А. Барнет, М.И. Бернстейн [и др.] / под редакцией У. Ли. - Москва : Мир, 1983. - Кн. 2. - 392 с.
86. Ли, У.А. Методы автоматического распознавания речи : в 2 книгах : пер. с англ. / У.А. Ли, Э.П. Нейбург, Т.Б. Мартин [и др.] ; под редакцией У. Ли. - Москва : Мир, 1983. - Кн. 1. - 328 с.
87. Болл, Р.М. Руководство по биометрии / Дж. Х. Коннел, Н.К. Ратха ; пер с англ. Н.Е. Агапова. - Москва : Техносфера, 2007. - 352 с.
88. Schuller, B. Hidden Markov model-based speech emotion recognition /
B. Schuller, G. Rigoll, M. Lang // 2003 International Conference on Multimedia and Expo. (ICME '03) (Cat. No.03TH8698) (Baltimore, 6-9 July 2003). -Baltimore, MD, USA : IEEE, 2003. - P. 401-404.
89. Mitra, P. Unsupervised feature selection using feature similarity / P. Mitra, C. Murthy, S. Pal // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2002. - № 3 (24). - P. 301-312.
90. Lowe, D.G. Object recognition from local scale-invariant features / D.G. Lowe // Seventh IEEE International Conference on Computer Vision (Kerkyra, 20-27 September 1999). - Kerkyra, Greece : IEEE, 1999. -P. 1150-1157.
91. Bishop, C.M. Neural Networks for Pattern Recognition / C.M. Bishop. First Edition. - Oxford : Oxford University Press, 1995-502 p.
92. Witten, I.H. Data Mining: Practical Machine Learning Tools and Techniques / I.H. Witten, E. Frank, M.A. Hall. Third Edition. - Los Atlos : Morgan Kauffmann, 2000. - 664 p.
93. Jain, A.K. Statistical pattern recognition: a review / A.K. Jain, R.P.W. Duin, J. Mao // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2000. - № 22 (1). - P. 4-37.
94. Duda, R.O. Pattern Recognition / R.O. Duda, P.E. Hart, D.G. Stork. -Second Edition. - Hoboken : Wiley-Interscience. - 2000. - 688 p.
95. Отт, Г. Методы подавления шумов и помех в электронных системах / пер. с англ. Б.Н. Бронина ; под редакцией М.В. Гальперина. - Москва : Мир, 1979. - 318 с.
96. Алимурадов, А.К. Фильтрация речевых сигналов с использованием метода множественной декомпозиции и оценки энергии эмпирических мод / А.К. Алимурадов, П.П. Чураков, А.Ю. Тычков // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2012. - № 4. -
C. 50-61.
97. Михайлов, Е.В. Помехозащищенность информационно-измерительных систем / Е.В. Михайлов. - Москва : Энергия, 1975. - 312 с.
98. Шахов, Э.К. Повышение помехоустойчивости цифровых средств измерения / Э.К. Шахов. - Пенза : ППИ, 1983. - 48 с.
99. ГОСТ 24375-80. Радиосвязь. Термины и определения. Введ. 01.04.1980. - Москва : Изд-во стандартов, 1980. - 12 с.
100. Huang, X. Spoken Language Processing. Guide to Algorithms and System Development / X. Huang, A. Acero, H.-W. Hon. - New Jersey : Prentice Hall, 2001. - 980 p.
101. Алимурадов, А.К. Адаптивная компенсация помех речевых сигналов с использованием комплементарной множественной декомпозиция на эмпирические моды / А.К. Алимурадов // Молодежь и XXI век - 2015 : материалы V Международной молодежной научной конференции (26-27 февраля 2015 года) : в 3 томах. - Курск : ЗАО «Университетская книга», 2015. - Т. 2. - С. 96-99.
102. Алимурадов, А.К. Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех / А.К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Контроль. - 2016. - № 1 (15). - С. 4-14.
103. Ткаченко, Т.А. Логопедическая энциклопедия / Т.А. Ткаченко. -Москва : Мир книги, 2010. - 280 с.
104. Дигун, О.Г. Сигналы, помехи, шумы / О.Г. Дигун, В.И. Веприков : учебное пособие. - Новочеркасск : Новочеркасский государственный технический университет, 1994. - 94 с.
105. Алимурадов, А.К. Адаптивный алгоритм оконной фильтрации речевых сигналов на основе декомпозиции на эмпирические моды / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2021») : материалы XIII Международной научно-технической конференции с элементами научной школы и конкурсом
научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 28-30 октября 2021 г.) / под редакцией доктора технических наук, профессора Е.А. Печерской. - Пенза : Изд-во ПГУ, 2021. -С. 140-143.
106. Boll, S. Suppression of acoustic noise in speech using spectral subtraction / S. Boll // IEEE Transactions on Acoustics, Speech, and Signal Processing. - 1979. - № 27 (2). - P. 113-120.
107. Wang, J. Spectral subtraction based on two-stage spectral estimation and modified cepstrum thresholding / J. Wang, H. Liu, Ch. Zheng, Xi. Lib // Applied Acoustics. - 2013. - № 74. - P. 450-453.
108. Berstein, A.D. A hypothesized Wiener filtering approach to noisy speech recognition / A.D. Berstein, I.D. Shallom // 1991 International Conference on Acoustics, Speech, and Signal Processing (ICASSP) (Toronto, 14-17 April 1991). - Toronto, ON, Canada : IEEE, 1991. - P. 913-916.
109. Furui, S. Cepstral analysis technique for automatic speaker verification / S. Furui // IEEE Transactions on Acoustics, Speech, and Signal Processing. - 1981. - № 29 (2). - P. 254-272.
110. Viikki, O. A recursive feature vector normalization approach for robust speech recognition in noise / O. Viikki, D. Bye, K. Laurila // 1998 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '98 (Cat. No.98CH36181) (Seattle, 15 May 1998). - Seattle, WA, USA : IEEE, 1998. - P. 733-736.
111. De La Torre, A. Histogram equalization of speech representation for robust speech recognition / A. De La Torre, A.M. Peinado, J.C. Segura, J.L. Perez-Cordoba, M.C. Benitez, A.J. Rubio // IEEE Transactions on Acoustics, Speech, and Signal Processing. - 2005. - № 13 (3). - P. 355-366.
112. Mohammad, E.H. Improved single-channel noise reduction method of speech by blind source separation / M.E. Hamid, K. Ogawa, T. Fukabayashi // Acoustical Science and Technology. - 2007. - № 28 (3) (Special Issue on "Applied Systems"). - P. 153-164.
113. Alimuradov, A.K. Noise-robust speech signals processing for the voice control system based on the complementary ensemble empirical mode decomposition / A.K. Alimuradov, P.P. Churakov // 2015 International Siberian Conference on Control and Communications (SIBCON) (Omsk, Russia, 21-23 May). - Omsk, Russia : IEEE, 2015. - 6 p.
114. Huang, N.E. Hilbert-Huang Transform and Its Applications / N.E. Huang, S.S.P. Shen. - New Jersey : World Scientific Publishing Company, 2005. - 324 p.
115. Huang, N.E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N.E. Huang, Sh. Zheng, R.L. Steven // Proceedings of the Royal Society of London. - 1998. - Vol. A 454. - P. 903-995.
116. Touati, H. Speech Denoising by Adaptive Filter LMS in the EMD Framework / H. Touati, K. Khaldi // 2018 15th International Multi-Conference on Systems, Signals & Devices (SSD) (19-22 March 2018). - Yasmine Hammamet, Tunisia : IEEE, 2018. - P. 1-4.
117. Shen, W. Speech Noise Reduction by EMD-LMS / W. Shen, Y. Yu, L. Ling, J. Ren, Q. Zhu // 2019 IEEE 7th International Conference on Computer Science and Network Technology (ICCSNT) (19-20 October 2019). - Dalian, China : IEEE, 2019. - P. 485-488.
118. Bouchair, A. Empirical Mode Decomposition for Speech Enhancement / A. Bouchair, A. Amrouche, S.-A. Selouani, M. Hamidia // 2018 International Conference on Electrical Sciences and Technologies in Maghreb (CISTEM) (28-31 October 2018). - Algiers, Algeria : IEEE, 2018. - P. 1-4.
119. Алимурадов, А.К. Способ повышения эффективности сегментации речь/пауза на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Агейкин, А.В. Кузьмин, М.А. Митрохин, И.А. Чернов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2021. - № 2 (58). -С. 24-43.
120. Childers, D.G. Silent and voiced/unvoied/ mixed excitation (four-way), classification of speech / D.G. Childers, M. Hand, J.M. Larar // IEEE Transaction on ASSP. - 1989. - № 37 (11). - P. 1771-1774.
121. Atal, B. A pattern recognition approach to voiced unvoiced-silence classification with applications to speech recognition / B. Atal, L.R. Rabiner // IEEE Trans. Acoust. Speech Signal Process. - 1976. - № 3 (24). - P. 201-212.
122. Martin, A. Robust speech/non-speech detection using LDA applied to MFCC / A. Martin, D. Charlet, L. Mauuary // 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.01CH37221) (ICASSP2001) (Salt Lake City, May 7-11 2001). - Salt Lake City, UT, USA : IEEE, 2001. - № 1. - P. 237-240.
123. Hlavnicka, J. Automated analysis of connected speech reveals early biomarkers of Parkinson's disease in patients with rapid eye movement sleep behaviour disorder / J. Hlavnicka, R. Cmejla, T. Tykalova, K. Sonka, E. R^icka, J. Rusz // Scientific Reports. - 2017. - № 7 (12). - 13 p.
124. Shin, W. H. Speech/non-speech classification using multiple features for robust endpoint detection / W.H. Shin, B.S. Lee, Y.K. Lee, J.S. Lee // 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.00CH37100) (Istanbul, June 5-9 2000). - Istanbul, Turkey : IEEE, 2000. - № 1. - P. 1399-1402.
125. Wuand, G.D. Word boundary detection with mel scale frequency bank in noisy environment / G. D. Wuand and C. T. Lin // IEEE Transactions on Speech and Audio Processing. - 2000. - № 8 (5). - P. 541-554.
126. Алимурадов, А.К. Краткий обзор современного состояния оценки психоэмоционального состояния на основе анализа речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Методы, средства и технологии получения и обработки измерительной информации : материалы Международной научно-технической конференции «Шляндинские чтения -2018», посвященной 100-летию со дня рождения В.М. Шляндина (г. Пенза, 19-21 ноября 2018 г.). - Пенза : Изд-во ПГУ, 2018. - С. 155-159.
127. Алимурадов, А.К. Краткий обзор существующих баз данных эмоциональной речи: современное состояние, проблемы и перспективы развития / А.К. Алимурадов, Е.А. Фокина, А.Е. Журина // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2020»): материалы XII Международной научно-технической конференции с элементами научной школы и конкурсом научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 16-18 марта 2020 г.) / под редакцией доктора технических наук Е.А. Печерской. - Пенза : Изд-во ПГУ, 2020. - С. 292-294.
128. Алимурадов, А.К. Оценка психоэмоционального состояния на основе анализа речевых сигналов: современное состояние, проблемы и перспективы / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Агейкин // Перспективные информационные технологии (ПИТ 2018) : труды Международной научно-технической конференции / под редакцией С.А. Прохорова. - Самара : Издательство Самарского научного центра РАН, 2018. - С. 677-681.
129. Trigeorgis, G. Adieu features? End-to-end speech emotion recognition using a deep convolutional recurrent network / G. Trigeorgis, F. Ringeval, R. Brueckner, E. Marchi, M.A. Nicolaou, B. Schuller, S. Zafeiriou // 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (Shanghai, China, 20-25 March 2016). - Shanghai, China : IEEE, 2016. - P. 5200-5204.
130. Левин, А.М. Особенности реализации систем идентификации диктора / А.М. Левин, С.В. Ульдинович // DSPA-2008 : сборник статей 10 Международной конференции. - Москва, 2008. - С. 175 - 178.
131. Шелухин, О.И. Цифровая обработка и передачи речи / под редакцией О.И. Шелухина, Н.Ф. Лукъянцева. - Москва : Радио и связь, 2000. - 456 с.
132. Dorry, M.K. Emotion Identification from Spontaneous Communication: A Thesis Submitted to the Department of Computer Science in
Partial Fulfilment for the Degree of Master of Science in Computer Science / M.K. Dorry. - Addis Ababa, Ethiopia, 2016. - P. 93.
133. Schwenzer, M. Impaired pitch identification as a potential marker for depression / M. Schwenzer, E. Zattarin, M. Grozinger, K. Mathiak // BMC Psychiatry. - 2012. - Vol. 12, - iss. 1. - P. 32-37.
134. Morist, M.U. Emotional speech synthesis for a radio dj: corpus design and expression modeling: master thesis MTG-UPF dissertation / M.U. Morist. -Barcelona, 2010.
135. Yingthawornsuk, T. Analysis of Speech Based on Spectral Entropy in Detecting Depressed among Control Subjects / T. Yingthawornsuk // International Conference on Computer and Communication Technologies (ICCCT'2012), May 26-27, 2012. - Phuket, 2012.
136. Yu, B. Cognitive impaiment prediction in the elderly based on vocal biomarkers / B.Yu, T.F. Quatieri, J.R. Williamson, J.C. Mundt // Sixteenth Annual Conference of the International Speech Communication Association. - Dresden Germany, 2015. - Р. 3734-3738.
137. Grossberg, S. The Adaptive Self-organization of Serial Order in Behavior: Speech, Language / S. Grossberg // Pattern recognition by humans and machines: Speech perception. - 2013. - P. 187.
138. Анализ и синтез речи : сб. науч. трудов / научный редактор Б.М. Лобанов. - Минск : АН БССР, 1991. - 47 с.
139. Винцюк, Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винтюк. - Киев : Нукова думка, 1987. - 264 с.
140. Фролов, А.В. Синтез и распознавание речи. Современные решения / Г.В. Фролов. - Москва : Связь, 2003. - 216 с.
141. Михайлов, В.Г. Измерение параметров речи / В.Г. Михайлов, Л.В. Златоусова ; под редакцией М.А. Сапожникова. - Москва : Радио и связь, 1987. - 168 с.
142. Сергиенко, А.Б. Цифровая обработка сигналов / А.Б. Сергиенко. -Санкт-Петербург : Питер, 2002. - 608 с.
143. Tychkov, A.Yu. The software solutions of the problems of the biomedical information processing / А.Ю. Тычков // Модели, системы, сети в экономике, технике, природе и обществе. - 2013. - № (5). - С. 114-116.
144. Huang, E. Huang, Samuel S.P. Shen. "Hilbert-Huang Transform and its application. Interdisciplinary mathematical sciences", Interdisciplinary Mathematical Sciences (Book 5) / Huang E. Huang, Samuel S.P. Shen. - World Scientific Publishing Company, 2005. - 324 p.
145. Козлов, А.С., Малышев В.Н. Кепстральный анализ в задачах слепой оценки скорости передачи цифровых данных / А.С. Козлов // Радиотехника. - 2012. - № 7. - С. 67-71.
146. Любимов, А. Линейное предсказание речи - это просто / А. Любимов, М. Евсиков // Монитор. - 1995. - № 4. - С. 30-35.
147. Баскаков, С.И. Радиотехнические цепи и сигналы / С.И. Баскаков. - Москва : Высшая школа, 2001. - 214 с.
148. Schuller, B., Lang M., Rigoll G. Robust acoustic speech emotion recognition by ensembles of classifiers / B. Schuller, M. Lang, G. Rigoll // Proceedings of the DAGA'05, 31. - Deutsche Jahrestagung für Akustik, DEGA, 2005. - P. 329-330.
149. Lugger, M. Combining classifiers with diverse feature sets for robust speaker independent emotion recognition / M. Lugger, B. Yang // 17th European Signal Processing Conference (EUSIPCO 2009). - 2009.
150. Lee, C. Combining acoustic and language information for emotion recognition / C. Lee, R. Pieraccini // 7th International Conference on Spoken Language Processing (Denver, Colorado, USA, 16-20 September 2002). - Denver, 2002. - P. 873-876.
151. Otsuka, T., Ohya J. Recognizing multiple persons' facial expressions using hmm based on automatic extraction of significant frames from image sequences / T. Otsuka, J. Ohya // Proceedings of the International Conference on Image Processing (ICIP-97). - 1997. - P. 546-549.
152. Fu, L. Speaker independent emotion recognition based on SVM/HMMS fusion system / L. Fu, X. Mao, L. Chen // 2008 International Conference on Audio, Language and Image Processing (Shanghai, China, 07-09 July 2008). - Shanghai : IEEE, 2008. - P. 61-65.
153. Womack, B.D. N-channel hidden Markov models for combined stressed speech classification and recognition / B.D. Womack, J.H.L. Hansen // IEEE Transactions on Speech and Audio Processing (1 November 1999). - 1999. -№ 6 (7). - P. 668-677.
154. Ververidis, D. Emotional speech recognition: resources, features and methods / D. Ververidis, C. Kotropoulos // Speech Communication (September 2006). - 2006. - № 9 (48). - P. 1162-1181.
155. Reynolds, D. Speaker verification using adapted Gaussian mixture models / D. Reynolds, T. Quatieri, R. Dunn // Digital Signal Process. - 2000. -Vol. 10. - P. 19-41.
156. Rabiner, L., Juang B. An introduction to hidden Markov models / L. Rabiner, B. Juang // IEEE ASSP Mag. - 1986. - Vol. 3 (1). - P. 4-16.
157. Ephraim, Y., Merhav N. Hidden Markov processes / Y. Ephraim, N. Merhav // IEEE Trans. Inf. Theory. - 2002. - Vol. 48 (6). - P. 1518-1569.
158. Dempster, A., Laird N., Rubin D. Maximum likelihood from incomplete data via the EM algorithm / A. Dempster, N. Laird, D. Rubin // Journal of the Royal Statistical Society. - 1977. - Vol. 39. - P. 1-38.
159. Lugger, M., Yang B., Wokurek W. Robust estimation of voice quality parameters under realworld disturbances / M. Lugger, B. Yang, W. Wokurek // 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, 2006, ICASSP 2006 Proceedings. - 2006. - Vol. 1. - P. I-I.
160. Tsymbal, A., Pechenizkiy M., Cunningham P. Diversity in search strategies for ensemble feature selection / A. Tsymbal, M. Pechenizkiy, P. Cunningham // Information Fusion. - 2005. - Vol. 6, № 32. - P. 146-156.
161. Reynolds, D., Rose C. Robust text-independent speaker identification using Gaussian mixture speaker models / D. Reynolds, C. Rose // IEEE Trans. Speech Audio Process. - 1995. - Vol. 3, № 1. - P. 72-83.
162. Rissanen, J. Modeling by shortest data description / J. Rissanen // Automatica. - 1978. Vol. 14, № 5. - P. 465-471.
163. Akaike, H. A new look at the statistical model identification / H. Akaike // IEEE Transactions Automatic Control. - 1974. - Vol. 19, № 6. - P. 716-723.
164. Abu El-Yazeed, M. On the determination of optimal model order for GMM-based text-independent speaker identification / M. Abu El-Yazeed, M. El Gamal, M. El Ayadi // EURASIP Journal on Advances in Signal Processing. - 2004. - Vol. 8. - P. 1078-1087.
165. Vlassis, N., Likas A. A kurtosis-based dynamic approach to Gaussian mixture modeling / N. Vlassis, A. Likas // IEEE Transactions on Systems, Man and Cybernetics. - 1999. - Vol. 29, № 4. - P. 393-399.
166. Breazeal, C., Aryananda L. Recognition of affective communicative intent in robot-directed speech / C. Breazeal, L. Aryananda // Autonomous Robots. - 2002. - Vol. 2. - P. 83-104.
167. Slaney, M., McRoberts G. Babyears: a recognition system for affective vocalizations / M. Slaney, G. McRoberts // Speech Communication. -2003. - Vol. 39. - P. 367-384.
168. Schuller, B. Towards intuitive speech interaction by the integration of emotional aspects / B. Schuller // 2002 IEEE International Conference on Systems, Man and Cybernetics. - 2002. - Vol. 6. - P. 6.
169. Petrushin, V. Emotion recognition in speech signal: experimental study, development and application / V. Petrushin // Proceedings of the ICSLP 2000. - 2000. - P. 222-225.
170. Hozjan, V., Moreno Z., Bonafonte A., Nogueiras A. Interface databases: design and collection of a multilingual emotional speech database / V. Hozjan, Z. Moreno, A. Bonafonte, A. Nogueiras // Proceedings of the 3rd
International Conference on Language Resources and Evaluation (LREC'02). -Las Palmas de Gran Canaria, Spain, 2002. - P. 2019-2023.
171. Lee, C., Narayanan S., Pieraccini R. Classifying emotions in human-machine spoken dialogs / C. Lee, S. Narayanan, R. Pieraccini // Proceedings of the ICME'02. - 2002. - Vol. 1. - P. 737-740.
172. Burges, C.J.C. A tutorial on support vector machines for pattern recognition / C.J.C. Burges // Data Mining and Knowledge Discovery. - 1998. -Vol. 2, № 2. - P. 121-167.
173. Cristianini, N. An Introduction to Support Vector Machines / N. Cristianini, J. Shawe-Taylor. - Cambridge University Press, 2000.
174. Go, H. Emotion recognition from the facial image and speech signal / H. Go, K. Kwak, D. Lee, M. Chun // Proceedings of the IEEE SICE 2003. - 2003. - Vol. 3. - P. 2890-2895.
175. Kwon, O. Emotion recognition by speech signal / O. Kwon, K. Chan, J. Hao, T. Lee // EUROSPEECH. - Geneva, 2003. - P. 125-128.
176. Razak, A. Comparison between fuzzy and NN method for speech emotion recognition / A. Razak, R. Komiya, M. Abidin // Third International Conference on Information Technology and Applications (ICITA'05) (Sydney, NSW, Australia, 4-7 July 2005). - Sydney : IEEE, 2005. - P. 297-302.
177. Pierre-Yves, O. The production and recognition of emotions in speech: features and algorithms / O. Pierre-Yves // International Journal of HumanComputer Studies. - 2003. - № 1 (59). - P. 157-183.
178. Kuncheva, L.I., Combining Pattern Classifiers: Methods and Algorithms / L.I. Kuncheva. - Hoboken, NewJersey : JohnWiley&Sons, 2004.
179. Mashao, D. Combining classifier decisions for robust speaker identification / D. Mashao, M. Skosan // Pattern Recognition. - 2006. - Vol. 39, № 1. - P. 147-155.
180. Kuncheva, L.I. A theoretical study on six classifier fusion strategies / L.I. Kuncheva // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2002. - Vol. 24. - P. 281-286.
181. Lugger, M., Yang B. Psychological motivated multi-stage emotion classification exploiting voice quality features / M. Lugger, B. Yang // Speech Recognition / eds. by F. Mihelic, J. Zibert. - Vienna : In-Tech, 2008.
182. Burkhardt, F. A database of German emotional speech / F. Burkhardt, A. Paeschke, M. Rolfes, W. Sendlmeier, B. Weiss // Proceedings of the Interspeech 2005. - Lissabon, Portugal, 2005. P. 1517-1520.
183. Freund, Y. A decision-theoretic generalization of on-line learning and an application to boosting / Y. Freund, R.E. Schapire // Journal of Computer and Systems Sciences. - 1997. - Vol. 55 (1). - P. 119-139.
184. Stevens, K. Classification of glottal vibration from acoustic measurements / K. Stevens, H. Hanson // Vocal Fold Physiology. - 1994. -P. 147-170.
185. Lugger, M. The relevance of voice quality features in speaker independent emotion recognition / M. Lugger, B. Yang // IEEE International Conference on Acoustics, Speech and Signal Processing, 2007, ICASSP 2007. -2007. - Vol. 4. - P. IV-17-IV-20.
186. Moataz, A. Survey on speech emotion recognition: Features, classification schemes, and databases / A. Moataz, S.K. Mohamed, K. Fakhri // Pattern Recognition. - 2011. - № 44 (3). - P. 572-587.
187. Dogdu, C. A Comparison of Machine Learning Algorithms and Feature Sets for Automatic Vocal Emotion Recognition in Speech / C. Dogdu, T. Kessler, D. Schneider, M. Shadaydeh, S.R. Schweinberger // Sensors. - 2022. - № 22 (19). - 15 p.
188. Campbell, W. Databases of emotional speech / W. Campbell // Proceedings of the ISCA (International Speech Communication and Association) ITRW on Speech and Emotion. - 2000. - P. 34-38.
189. You, M. Getting started with susas: a speech under simulated and actual stress database / M. You, C. Chen, J. Bu, J. Liu, J. Tao // EUROSPEECH-97. - 1997. - Vol. 4. - P. 1743-1746.
190. Engberg, S. Documentation of the danish emotional speech database DES / S. Engberg, A. V. Hansen // Internal AAU report, Center for Person Kommunikation. - Denmark, 1996.
191. Berlin Database of Emotional Speech [Электронный ресурс]. -URL: http://emodb.bilderbar.info/docu/
192. Makarova, V. Ruslana: a database of Russain emotional utterances / V. Makarova, V. Petrushin // Conference: 7th International Conference on Spoken Language Processing, ICSLP2002 September 16-20, 2002). - Interspeech, 2002, Denver, Colorado, USA, 2002. - P. 2041-2044,
193. Batliner, A. Releasing a thoroughly annotated and processed spontaneous emotional database: the FAU Aibo Emotion Corpus / A. Batliner, S.Steidl, E. Noeth // Proc. of a Satellite Workshop of LREC 2008 on Corpora for Research on Emotion and Affect Marrakesh. - 2008.
194. Grimm, M. The Vera am Mittag German Audio-Visual Emotional Speech Database / M. Grimm, K. Kroschel, S. Narayanan // 2008 IEEE International Conference on Multimedia and Expo. - 2008. - P. 865-868.
195. Gajsek, R. Multi-Modal Emotional Database: AvID. Informatica / R. Gajsek, V. Struc, F. Mihelic, A. Podlesek, L. Komidar, G. Socan, B. Bajec // Informatica (Slovenia). - 2009. - Vol. 33, № 1. - P. 101-106.
196. Surrey Audio-Visual Expressed Emotion (SAVEE) Database [Электронный ресурс]. - URL: http://kahlan.eps.surrey.ac.uk/savee/
197. Oflazoglu, C. Turkish emotional speech database / C. Oflazoglu, S. Yildirim // In Proc. IEEE 19th Conf. Signal Processing and Communications Applications (SIU). - 2011. - P. 1153-1156.
198. Turkish Emotional Speech Database: TURES [Электронный ресурс]. - URL: http://www.turesdatabase.com (дата обращения 10.04.2023).
199. Speech Resources Consortium(NII-SRC) [Электронный ресурса-URL: http://research.nii.ac.jp/src/en/OGVC.html (дата обращения 10.04.2023).
200. Arimoto, Y. Naturalistic emotional speech collection paradigm with online game and its psychological and acoustical assessment / Y. Arimoto,
H. Kawatsu, S. Ohno, and H. Iida // Acoustical Science and Technology. - 2012. - Vol. 33, № 6. - P. 359-369.
201. Wang, K.X. A database of elderly emotional speech / K.X. Wang, Q.L. Zhang, S.Y. Liao // in Proc. Int. Symp. Signal Process. Biomed. Eng Informat. - 2014. -P. 549-553.
202. Keio University Japanese Emotional Speech Database [Электронный ресурс]. - URL: http://shachi.org/resources/4285 (дата обращения 10.04.2023).
203. Moriyama, T. A Synthesis Method of Emotional Speech Using Subspace Constraints in Prosody / T. Moriyama, S. Mori, S. Ozawa // Journal of Information Processing. - 2009. - Vol. 50, № 3. - P. 1181-1191.
204. Zhang, H. A Database of Japanese Emotional Signals Elicited by Real Experiences / H. Zhang, G.F. Lopez, M. Shuzo, I. Yamada // Lecture Notes of ICST, Pervasive Computing Paradigms for Mental Health (4th International Symposium, MindCare 2014, Tokyo, Japan, May 8-9, 2014, Revised Selected Papers). Projects: Wearable Healthcare Monitoring (Development of Wearable Biological Sensors and Analytical Techniques). - Springer International Publishing, 2014. - doi: 10.13140/2.1.5098.5604
205. Livingstone, S.R. The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS): A dynamic, multimodal set of facial and vocal expressions in North American English / S.R. Livingstone, F. Russo // PLoS ONE. -2018. - Vol. 13, № 5. - P. e0196391. - doi: 10.1371/journal.pone.0196391
206. Geethashree, A. Kannada Emotional Speech Database: Design, Development and Evaluation / A. Geethashree, D.J. Ravi // Proceedings of International Conference on Cognition and Recognition / eds. by D. Guru, T. Vasudev, H. Chethan, Y. Kumar. Lecture Notes in Networks and Systems. Springer, Singapore, 2018. - Vol. 14. - P. 357-369.
207. Sapinski, T. Multimodal Database of Emotional Speech, Video and Gestures International / T. Sapinski, D. Kaminska, A. Pelikant, E. Avots, C. Ozcinar, G. Anbarjafari // Science Index, Computer and Information Engineering. - 2018. - Vol. 12, № 10.
208. Lassalle, A. The EU-Emotion Voice Database / A. Lassalle, D. Pigat, H. O'Reilly [et al.] // Behavior Research Methods. - 2019. - Vol. 51. - P. 493-506. -URL: https://doi.org/10.3758/s13428-018-1048-1
209. Алимурадов, А.К. Способ повышения эффективности оценки психоэмоционального состояния операторов систем управления с высокой степенью ответственности / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Новые информационные технологии и системы : материалы XV МНТК, посвященной 75-летию Пензенского государственного университета (г. Пенза, 20-21 ноября 2018 г.). - Пенза : Изд-во ПГУ, 2018. - С. 97-100.
210. Министерство Российской Федерации по делам гражданской обороны, чрезвычайным ситуациям и ликвидации последствий стихийных бедствий [Электронный ресурс]. - URL: https://www.mchs.gov.ru (дата обращения: 09.09.2022).
211. Free, open source, cross-platform audio software Audacity [Электронный ресурс]. - URL: https://www.audacityteam.org (дата обращения: 05.02.2023).
212. Alimuradov, A.K. Development of Natural Emotional Speech Database for Training Automatic Recognition Systems of Stressful Emotions in Human-Robot Interaction / A.K. Alimuradov, A.Yu. Tychkov, V.N. Gorbunov, A.V. Ageykin, E.A. Fokina, A.E. Zhurina, V.A. Mezhina, E.K. Reva // 2020 4th Scientific School on Dynamics of Complex Networks and their Application in Intellectual Robotics (DCNAIR), Sept. 7-9. - Innopolis, Russia, 2020. - P. 11-16.
213. Алимурадов, А.К. Разработка базы естественной эмоциональной речи / А.К. Алимурадов, И.О. Стешкин, Б.А. Порезанов, К.Е. Платонов // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2022») : материалы XIII Международной научно-технической конференции с элементами научной школы и конкурсом научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 24-26 октября 2022 г.) / под
редакцией под редакцией доктора технических наук, профессора
E.А. Печерской. - Пенза : Изд-во ПГУ, 2022. - С. 176-179.
214. Алимурадов, А.К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи / А.К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Контроль. - 2015. -№ 2 (12). - С. 27-35.
215. Mi, X. Wind speed prediction model using singular spectrum analysis, empirical mode decomposition and convolutional support vector machine / X. Mi, H. Liu, Y. Li // Energy Conversion and Management. - 2019. - Vol. 80. -P. 196-205.
216. Wu, Z. The impact of global warming on enso variability in climate records / Z. Wu, E. Schneider, Z. Hu, L. Cao // Tech. report, Cent. Ocean. Stud. -2002. - Vol. 110. - 25 p.
217. Lee, T. Multivariate Nonstationary Oscillation Simulation of Climate Indices With Empirical Mode Decomposition / T. Lee, T. B. M. J. Ouarda // Water Resources Research. - 2019. - Vol. 55, № 6. - P. 5033-5052.
218. Labate, D. Empirical mode decomposition vs. wavelet decomposition for the extraction of respiratory signal from single-channel ECG: A comparison / D. Labate, F.La Foresta, G. Occhiuto, F.C. Morabito, A. Lay-Ekuakille, P. Vergallo // IEEE Sensors Journal. - 2013. - Vol. 13, № 7. - P. 2666-2674.
219. Zhang, Y. The removal of wall components in doppler ultrasound signals by using the empirical mode decomposition algorithm / Y. Zhang, Y. Gao, L. Wang, J. Chen, X. Shi // IEEE Transactions on Biomedical Engineering. -2007. - Vol. 54, № 9. - P. 1631-1642.
220. Andrade, A.O. EMG signal filtering based on Empirical Mode Decomposition / A.O. Andrade, S. Nasuto, P. Kyberd, C.M. Sweeney-Reed,
F.R. Van Kanijn // Biomedical Signal Processing and Control. - 2006. - Vol. 1, № 1. - P. 44-55.
221. Schlotthauer, G. A new algorithm for instantaneous F0 speech extraction based on ensemble empirical mode decomposition / G. Schlotthauer,
M.E. Torres, H.L. Rufiner // 2009 17th European Signal Processing Conference (Aug. 24-28, 2009). - Glasgow, UK, 2009. - P. 2347-2351.
222. Bouzid, A. Empirical mode decomposition of voiced speech signal / A. Bouzid, N. Ellouze // First International Symposium on Control, Communications and Signal Processing (March 21-24, 2004). - Tunisia, Hammamet, 2004. - P. 603-606.
223. Sethu, V. Empirical mode decomposition based weighted frequency feature for speech-based emotion classification / V. Sethu, E. Ambikairajah, J. Epps // 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (31 March - 4 April). - Las Vegas, NV, USA, 2008. - P. 5017-5020.
224. Ali, M. Significant wave height forecasting via an extreme learning machine model integrated with improved complete ensemble empirical mode decomposition / M. Ali, R. Prasad // Renewable and Sustainable Energy Reviews. - 2019. - Vol. 104. - P. 281-295.
225. Prasad, R. Designing a multi-stage multivariate empirical mode decomposition coupled with ant colony optimization and random forest model to forecast monthly solar radiation / R. Prasad, M. Ali, P. Kwan, H. Khan // Applied Energy. - 2019. - Vol. 236. - P. 778-792.
226. Huang, H. Speech pitch determination based on Hilbert-Huang transform / H. Huang, J. Pan // Signal Processing. - 2006. - Vol. 86, № 4. - P. 792-803.
227. Wu, J.D. Speaker identification system using empirical mode decomposition and an artificial neural network / J.D. Wu, Y.J. Tsai // Expert Systems with Applications. - 2011. - Vol. 38, № 5. - P. 6112-6117.
228. Huang, N.E. Empirical mode decomposition for analyzing acoustical signals. US patent No. 6,862,558 B2, 01.03.2005 / N.E. Huang // Journal of the Acoustical Society of America. - 2005. - Vol. 118, № 2.
229. Hasan, T. Suppression of residual noise from speech signals using empirical mode decomposition / T. Hasan, M.K. Hasan // IEEE Signal Processing Letters. - 2009. - Vol. 16, № 1. - P. 2-5.
230. Chu, Y.Y. Speech Emotion Recognition Based on EMD in Noisy Environments / Y.Y. Chu, W.H. Xiong, Wei Chen // Advanced Materials Research. - 2013. - Vol. 831. - P.460-466.
231. Kerkeni, L. Automatic speech emotion recognition using an optimal combination of features based on EMD-TKEO / L. Kerkeni, Y. Serrestou, K. Raoof, M. Mbarki, M.A. Mahjoub, C. Cleder // Speech Communication. - 2019. -Vol. 114. - P. 22-35.
232. Shahnaz, C. Emotion recognition based on EMD-Wavelet analysis of speech signals / C. Shahnaz, S. Sultana, S.A. Fattah, R.H.M. Rafi, I. Ahmmed, W.-P. Zhu, M.O. Ahmad // 2015 IEEE International Conference on Digital Signal Processing (DSP) (July 21-24, 2015). - Singapore, 2015. - P. 307-310.
233. Li, X. EMD-TEO Based Speech Emotion Recognition / X. Li, Xin Li, X. Zheng, D. Zhang // Life System Modeling and Intelligent Computing. - 2010. -P. 180-189.
234. Toshihisa, T. Complex Empirical Mode Decomposition / T. Toshihisa, P.M. Danilo // Signal Processing Letters. - 2007. - № 14 (2). - P. 101-104.
235. Zhaohua, W. Ensemble empirical mode decomposition: A noise-assisted data analysis method / W. Zhaohua, N.E. Huang // Advances in Adaptive Data Analysis. - 2009. - № 1(1). - P. 1-41.
236. Yeh, J.-R. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method / J.-R. Yeh, J.-S. Shieh, N.E. Huang // Advances in Adaptive Data Analysis. - 2010. - Vol. 2, № 2. - P. 135-156.
237. Linderhed, A. 2-D empirical mode decompositions in the spirit of image compression // Wavelet and Independent Component Analysis Applications IX, vol. 4738 of Proceedings of SPIE, USA, 2007. - 178 p.
238. Meignen, S. Advances in Adaptive Data Analysis. The multidimensional ensemble empirical mode decomposition method // World Scientific Publishing Company. - 2009. - P. 339-372.
239. Torres, M.E A complete Ensemble Empirical Mode decomposition with adaptive noise / M.E. Torres, M.A. Colominas, G. Schlotthauer, P. Flandrin //
IEEE Int. Conf. on Acoust., Speech and Signal Proc. ICASSP-11. - Prague, 2011.
- p. 4144-4147.
240. Colominasa, M.A. Improved complete ensemble EMD: a suitable tool for biomedical signal processing / M.A. Colominasa, G. Schlotthauera, M.E. Torres // Biomed. Signal Proces. - 2014. - Vol. 14. - P. 19-29.
241. Alimuradov, A.K. EMD-Based Method for Windowed Filtering of Speech Signals / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov, B.A. Porezanov, I.O. Steshkin, M.V. Boyarkina, A.A. Khaliullina, and D.S. Dudnikov // 2021 5th Scientific School Dynamics of Complex Networks and their Applications (DCNA) (Russia, Kaliningrad, September 13-15). - Kaliningrad, 2021. - P. 6-9.
242. Алимурадов, А.К. Способ сегментации речь/пауза на основе энергетического оператора Тигера / А.К. Алимурадов // Модели, системы, сети в экономике, технике, природе и обществе. - 2021. - № 4. - С. 52-63.
243. Алимурадов, А.К. Алгоритм сегментации речь/пауза на основе декомпозиции на эмпирические моды и одномерного расстояния Махаланобиса / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Агейкин, А.П. Кулешов, И.А. Чернов // Труды Московского физико-технического института. - 2021. - Т. 13, № 3 (51). - С. 4-22.
244. Алимурадов, А.К. Повышение эффективности сегментации речевых сигналов на основе энергетического оператора Тигера / А.К. Алимурадов // Измерение. Мониторинг. Управление. Контроль. - 2021.
- № 3 (37). - С. 80-92.
245. Алимурадов, А.К. Помехоустойчивый способ сегментации речь/пауза на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. - 2021. - № 2 (38). - С. 40-66.
246. Алимурадов, А.К. Новый подход к обработке речевых сигналов на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов,
Б.А. Порезанов, И.О. Стешкин, К.Е. Платонов, Д.С. Дудников // Инжиниринг и технологии. - 2022. - Т. 7, № 1. - С. 15-20.
247. Алимурадов, А.К. Способ обработки речевых сигналов на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Баранова, Д.С. Дудников // Измерение. Мониторинг. Управление. Контроль. - 2022. - № 2 (40). - С. 75-89.
248. Alimuradov, A.K. EMD-Based Technique for Revealing Hidden Informative Speech Parameters to Assess Human Psycho-Emotional State /
A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov, B.A. Porezanov, I.O. Steshkin, K.E. Platonov, A.V. Baranova, and N.S. Bofanova // 2022 IEEE Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology (USBEREIT) (Yekaterinburg, Russia, September 19-21). - Yekaterinburg, 2022. -P. 012-015.
249. Alimuradov, A.K. Novel EMD-Based Technological Procedure for Speech Signal Processing / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov,
B.A. Porezanov, I.O. Steshkin, K.E. Platonov, A.V. Baranova, D.S. Dudnikov // 2022 24rd International Conference on Digital Signal Processing and its Applications (DSPA) (Russia, Moscow, March 30 - April 1). - Moscow, 2022. - 6 p.
250. Алимурадов, А.К. Исследование влияния длительности анализируемых речевых сигналов на частотно-избирательные свойства декомпозиции на эмпирические моды / А.К. Алимурадов, Е.А. Фокина, А.Е. Журина // Новые информационные технологии и системы : сборник научных статей XVI Международной научно-технической конференции (г. Пенза, 27-29 ноября 2019 г.). - Пенза : Изд-во ПГУ, 2019. - С. 201-205.
251. Alimuradov, A.K. Improvement of the Efficiency of Voice Control Based on the Complementary Ensemble Empirical Mode Decomposition / A.K. Alimuradov, P.P. Churakov, A.Yu. Tychkov, I.I. Artemov, and A.V. Kuzmin // 2016 International Siberian Conference on Control and Communications (SIBCON 2016), (Russia, Moscow, May 12-14, 2016). - Moscow, 2016. - 6 p.
252. Ткаченко, М.С. Система адаптивного подавления нестационарных шумов на основе многомасштабных преобразований / М.С. Ткаченко. - Москва : Московский государственный университет им. М.В. Ломоносова, 2010. - 62 с
253. Шушарин, А.С. Анализ возможностей шумоочистки речевой информации при многоканальном ведении технической разведки / А.С. Шумарин, В.П. Гуляев // Безопасность информационного пространства : труды 1-о Региональной научно-практической интернет-конференции студентов, аспирантов и молодых ученых (Екатеринбург, 11 мая 2011 г.). -Екатеринбург, 2011. - 14 с.
254. Чучупал, В.Я. Цифровая фильтрация зашумленных речевых сигналов / В.Я. Чучупал, А.С. Чичагов, К.А. Маковкин. - Москва : Вычислительный центр РАН, 1998. - 52 с.
255. Alimuradov, A.K. Speech signals filtering using the ensemble empirical mode decomposition method and the intrinsic mode functions energy assessment / A.K. Alimuradov // International Journal of Applied Engineering Research. - 2015. - Vol. 10, № 2. - P. 3175-3185.
256. Алимурадов, А.К. Новый подход к фильтрации речевых сигналов на основе улучшенной декомпозиции на эмпирические моды / А.К. Алимурадов, Б.А. Порезанов, И.О. Стешкин, К.Е. Платонов // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2022») : материалы XIV Международной научно-технической конференции с элементами научной школы и конкурсом научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 24-26 октября 2022 г.) / под редакцией доктора технических наук, профессора Е.А. Печерской. - Пенза : Изд-во ПГУ, 2022. -С. 173-176.
257. Свидетельство о государственной регистрации программы для ЭВМ № 2021666124. Программа оконной фильтрации речевых сигналов на основе декомпозиции на эмпирические моды / А.К. Алимурадов //
Программы для ЭВМ, базы данных, топологии интегральных микросхем ; заявл. 04.10.2021 ; опубл. 08.10.2021.
258. Алимурадов, А.К. Помехоустойчивый адаптивный способ сегментации речевых сигналов на основе декомпозиции на эмпирические моды / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Новые информационные технологии и системы (НИТиС-2021) : сборник научных статей по материалам XVIII Международной научно-технической конференции (г. Пенза, 24-26 ноября 2021 г.). - Пенза : Изд-во ПГУ, 2021. -С. 102-107.
259. . Alimuradov, A.K. A Method for Noise-Robust Speech Signal Processing to Assess Human Psycho-Emotional State / A.K. Alimuradov, A.Yu. Tychkov and P.P. Churakov // 2019 3rd School on Dynamics of Complex Networks and their Application in Intellectual Robotics (DCNAIR), (Russia, Innopolis, Sept. 9-11, 2019). - Innopolis, 2019. - P. 6-8.
260. Алимурадов, А.К. Помехоустойчивая обработка речевых сигналов для систем оценки психоэмоционального состояния человека / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Проблемы автоматизации и управления в технических системах : сборник статей по материалам XXXIII Международной научно-технической конференции, посвященной 55-летию образования кафедры «Автоматика и телемеханика» (г. Пенза, 22-23 мая 2019 г.) : в 2 т. - Пенза : Изд-во ПГУ, 2019. - Т. 1. - С. 192-195.
261. Алимурадов, А.К. Помехоустойчивый адаптивный алгоритм обработки речевых сигналов для систем обнаружения психоэмоционального состояния / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Перспективные информационные технологии (ПИТ 2018): труды Международной научно-технической конференции / под редакцией С.А. Прохорова. - Самара : Издательство Самарского научного центра РАН, 2018. - С. 673-677.
262. Свидетельство о государственной регистрации программы для ЭВМ № 2018613123. Программа субполосной адаптивной фильтрации акустических эхо-сигналов на основе комплементарной множественной
декомпозиции / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, Ю.С. Квитка // Программы для ЭВМ, базы данных, топологии интегральных микросхем ; заявл. 11.01.2018 ; опубл. 02.03.2018.
263. Zhu, W. Incorporating frequency masking filtering in a standard MFCC feature extraction algorithm / W. Zhu, D. O'Shaughnessy // Proceedings of the IEEE. International Conference on Signal Processing. - 2004. - P. 617-620.
264. Сергиенко, А.Б. Алгоритмы адаптивной фильтрации: особенности реализации в MATLAB / А.Б. Сергиенко // EXPonenta Pro. Математика в приложениях. - 2003. - № 1. - С. 18-28.
265. Muller K.-R. Independent Component Analysis for Environmentally Robust Speech Recognition / K.-R. Muller, R. Orglmeister, T.-W. Lee. Tag der wissenschaftlichen Aussprache: 21 Dezember 2007. - Berlin, 2007. - 221 p.
266. Huan, Zhao. Improved MFCC Feature Extraction Combining Symmetric ICA Algorithm for Robust Speech Recognition / Huan Zhao, Kai Zhao, He Liu // Journal of multimedia. - 2012. - Vol. 7, № 1. - P. 74-81.
267. Singh, R. Spectral Subtraction Speech Enhancement with RASTA Filtering / R. Singh, P. Rao // Proc. of National Conference on Communications (NCC). - Kanpur, India, 2007. - P. 1-5.
268. Hermansky, H. RASTA processing of speech / H. Hermansky, N. Morgan // IEEE Trans. Speech and Audio Proc.(October). - 1994. -Vol. 2 (4). - P. 578-589.
269. Hermansky, H. Rasta-PLP Speech Analysis / H. Hermansky, N. Morgan, A. Bayya, P. Kohn // ICSI Technical Report TR-91-069. - Berkeley, California. - 8 p.
270. Cheng, E. Time delay estimation of reverberant meeting speech: on the use of multichannel linear prediction / E. Cheng, I.S. Burnett, C.H. Ritz // International Conference on Signal Image Technology & Internet Based Systems (SITIS '07). - 2007. - P. 494-500.
271. Zha, W. Objective speech quality measurement using statistical data mining / W. Zha, W.-Y. Chan // EURASIP Journal on Advances in Signal Processing. - 2005. - Vol. 1 (9). - P. 1410-1424.
272. Falk, T.H. Speech Quality Estimation Using Gaussian Mixture Model / T.H. Falk, W.-Y. Chan, P. Kabal // Proc. Interspeech 2004 (Korea, Jeju Island, Oct. 2004). - 2004. - P. 2013-2016.
273. Martin, R. Statistical Methods for the Enhancement of Noisy Speech / R. Martin // Proc. IWAENC2003. - 2003. - P. 1-6.
274. Stoutenand, V. Application of Minimum Statistics and Minima Controlled Recursive Averaging Methods to Estimatea Cepstral Noise Model for Robust ASR / V. Stoutenand, H. Van Hammeand, P. Wambacq // Acoustics, Speech and Signal Processing, 2006. ICASSP 2006 Proceedings. - 2006. -Vol. 1. - 11 p.
275. Deng, L. Dynamic compensation of HMM variances using the feature enhancement uncertainty computed from aparametric model of speech distortion / L. Deng, J. Droppo, A. Acero // IEEE Transactions on Speech and Audio Processing (May 2005). - 2005. - Vol. 13 (3). - P. 412-421.
276. Алимурадов, А.К. Повышение эффективности сегментации речь/пауза на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов // Проблемы автоматизации и управления в технических системах : сборник научных статей по материалам XXXIV Всероссийской научно-технической конференции с международным участием (г. Пенза, 15-17 ноября 2021 г.) : в 2 т. / под редакцией доктора технических наук, профессора М.А. Щербакова. - Пенза : Изд-во ПГУ, 2021. - Т. I. -С. 147-151.
277. Алимурадов, А.К. Сегментация речевых сигналов на основе метода декомпозиции на эмпирические моды и вычисления ODMD / А.К. Алимурадов // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2021») : материалы XIII Международной научно-технической конференции с элементами научной школы и конкурсом научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 28-30 октября 2021 г.) / под
редакцией д доктора технических наук, профессора Е.А. Печерской. - Пенза : Изд-во ПГУ, 2021. - С. 144-147.
278. Алимурадов, А.К. Применение энергетического оператора Тигера в задаче сегментации речевых сигналов / А.К. Алимурадов // Инжиниринг и технологии. - 2021. - Т. 6, № 2. - С. 1-5.
279. Алимурадов, А.К. Повышение эффективности сегментации речь/пауза на основе энергетического оператора Тигера / А.К. Алимурадов // Информационные технологии в науке и образовании. Проблемы и перспективы : сборник статей по материалам VIII Всероссийской межвузовской научно-практической конференции (г. Пенза, 17 марта 2021 г.) / под редакцией Л.Р. Фионовой. - Пенза : Изд-во ПГУ, 2021. - С. 128-131.
280. Alimuradov, A.K. Speech/Pause Segmentation Method Based on Teager Energy Operator and Short-Time Energy Analysis / A.K. Alimuradov // 2021 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology (USBEREIT) (Russia, Yekaterinburg, May 13-14, 2021). - Yekaterinburg, 2021. - P. 0045-0048.
281. Alimuradov, A.K. Enhancement of speech signal segmentation using Teager energy operator / A.K. Alimuradov // 2021 23rd International Conference on Digital Signal Processing and its Applications (DSPA) (Russia, Moscow, March 24-26, 2021). - Moscow, 2021. - 7 p.
282. Alimuradov, A.K. EMD-Based Noise-Robust Method for Speech/Pause Segmentation / A.K. Alimuradov, A.Yu. Tychkov // 2021 3rd International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE) (Russia, Moscow, March 11-13, 2021). - Moscow, 2021. -8 p.
283. Alimuradov, A.K. EMD-Based Method to Improve the Efficiency of Speech/Pause Segmentation / A.K. Alimuradov, A.Yu. Tychkov // 2021 International Siberian Conference on Control and Communications (SIBCON) (Russia, Kazan, May 13-15, 2021). - Kazan, 2021. - 10 p.
284. Alimuradov, A.K. Improved Signal/Pause Segmentation Algorithm Based on the Probability Density Function of Background Noise and Empirical Mode Decomposition / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2021 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (ElConRus) (Russia, St. Petersburg, Moscow, Jan. 26-29, 2021). -St. Petersburg ; Moscow. - P. 1584-1589.
285. Greenwood, M.A. SUVing: automatic silence/unvoiced/voiced classification of speech / M.A. Greenwood, A. Kinghorn // Undergraduate Coursework, Department of Computer Science. - The University of Sheffield, UK, 1999. - 4 p.
286. Duda, R.O. Pattern Classification / R.O. Duda, P.E. Hart, D.G. Strok. - 2nd ed. - New Jersey : A Wiley-Interscience Publ. John Wiley & Sons, 2001. -688 p.
287. Saha, G. A new silence removal and endpoint detection algorithm for speech and speaker recognition applications / G. Saha, S. Chakroborty, S. Senapat, // Eleventh National Conference on Communications (NCC-2005) (Jan. 28-30, 2005). -Kharagpur, India, 2005. - P. 51-61.
288. Алимурадов, А.К. Новый подход сегментации речевых сигналов на основе частотно-временного анализа / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, Д.С. Дудников // Измерение. Мониторинг. Управление. Контроль. - 2022. - № 4 (42). - С. 80-91.
289. Alimuradov, A.K. A Novel Approach to Speech Signal Segmentation Based on Time-Frequency Analysis / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov, D.S. Dudnikov // 2022 6th Scientific School Dynamics of Complex Networks and their Applications (DCNA) (Russia, Kaliningrad, September 14-16, 2022). - Kaliningrad, 2022. - P. 8-13.
290. Алимурадов, А.К. Алгоритм измерения частоты основного тона речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды / А.К. Алимурадов // Измерительная техника. - 2016. -№ 12 - С. 53-57.
291. Алимурадов, А.К. Разработка алгоритма измерения частоты основного тона речевых сигналов в среде графического программирования LABVIEW / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // NI Academic Days 2017 - Инженерные приложения и научные разработки на базе технологий National Instruments : сборник трудов Международной научно-практической конференции (Москва, 13-14 апреля 2017 г.) - Москва : ДМК-пресс, 2017. - С. 208-210.
292. Alimuradov, A.K. An Algorithm for Measurement of the Pitch Frequency of Speech Signals Based on Complementary Ensemble Decomposition Into Empirical Modes / A.K. Alimuradov // Measurement techniques. - 2017. -Vol. 59, № 12. - P. 1316-1323.
293. Алимурадов, А.К. Разработка алгоритма обработки речевых сигналов для определения информативно-значимых параметров пограничных психических расстройств / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Агейкин // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2017. - № 3 (47). - С. 4-25.
294. Алимурадов, А.К. Способ определения кепстральных маркеров речевых сигналов при психогенных расстройствах / А.К. Алимурадов, А.Ю. Тычков, А.П. Зарецкий, А.П. Кулешов // Труды Московского физико-технического института. - 2017. - Т. 9, № 4. - С. 201-214.
295. Alimuradov, A.K. Measurement of Speech Signal Patterns under Borderline Mental Disorders / A.K. Alimuradov, A.Yu. Tychkov, A.V. Kuzmin, P.P. Churakov, A.V. Ageykin, G.V. Vishnevskaya // 2017 21st Conference of Open Innovations Association (FRUCT) (Nov. 6-10, 2017). - Helsinki, Finland, 2017. - P. 26-33.
296. Alimuradov, A.K. Improved CEEMDAN based speech signal analysis algorithm for mental disorders diagnostic system. Pitch frequency detection and measurement / A.K. Alimuradov, A.Yu. Tychkov, A.V. Kuzmin, P.P. Churakov, A.V. Ageykin, G.V. Vishnevskaya // International Journal of Embedded and RealTime Communication Systems (IJERTCS). - 2019. - Vol. 10, iss. 1. - P. 22-47.
297. Алимурадов, А.К. Алгоритм измерения акустических паттернов речевых сигналов естественно выраженных психоэмоциональных состояний / А.К. Алимурадов, А.В. Агейкин // Международная конференция по мягким вычислениям и измерениям : тезисы докладов на конференции (г. Санкт-Петербург, 23-25 мая 2018 г.). - Санкт-Петербург : Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина), 2018. - Т. 2. - С. 124-127.
298. Алимурадов, А.К. Способ адаптивного измерения просодических характеристик речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Международная конференция по мягким вычислениям и измерениям : тезисы докладов на конференции (г. Санкт-Петербург, 23-25 мая 2018 г.). - Санкт-Петербург : Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина), 2018. - Т. 2. - С. 107-110.
299. Алимурадов, А.К. Помехозащищенный анализ просодических характеристик речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Информационные технологии в науке и образовании. Проблемы и перспективы : сборник научных статей Всероссийской межвузовской научно-практической конференции (г. Пенза, 14 марта 2018 г.) / под редакцией Л. Р. Фионовой. - Пенза : Изд-во ПГУ, 2018. - С. 128-129.
300. Алимурадов, А.К. Способ определения психоэмоционального состояния человека на основе анализа кепстральных характеристик речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Информационные технологии в науке и образовании. Проблемы и перспективы : сборник научных статей Всероссийской межвузовской научно-практической конференции. (г. Пенза, 14 марта 2018 г.) / под редакцией Л. Р. Фионовой. -Пенза : Изд-во ПГУ, 2018. - С. 130-132.
301. Alimuradov, A.K. A method to determine cepstral markers of speech signals under psychogenic disorders / A.K. Alimuradov, A.Yu. Tychkov, A.V. Ageykin, P.P. Churakov // 2018 Ural Symposium on Biomedical
Engineering, Radioelectronics and Information Technology (USBEREIT) (Russia, Yekaterinburg, May 7-8, 2018). - Yekaterinburg, 2018. - P. 128-131.
302. Алимурадов, А.К. Повышение эффективности обнаружения психических расстройств на основе адаптивной декомпозиции и кепстрального анализа речевых сигналов / А.К. Алимурадов, А.Ю. Тычков // Физика и Радиоэлектроника в Медицине и Экологии (ФРЭМЭ'2018) : труды XIII Международной научной конференции ФРЭМЭ'2018 с научной молодежной школы им. И.Н. Спиридонова (3-5 июля 2018 г.) / под редакцией Л.Т. Сушковой. - Владимир-Суздаль : Изд-во Владимирского государственного университета им. Александра Григорьевича и Николая Григорьевича Столетовых, 2018. - Кн. 1. - С. 405-409.
303. Алимурадов, А.К. Способ измерения акустических паттернов речевых сигналов психоэмоциональных состояний на основе адаптивной декомпозиции и энергетического анализа эмпирических мод /
A.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, А.В. Агейкин // Методы, средства и технологии получения и обработки измерительной информации : материалы Международной научно-технической конференции «Шляндинские чтения - 2018», посвященная 100-летию со дня рождения
B.М. Шляндина (г. Пенза, 19-21 ноября 2018 г.). - Пенза : Изд-во ПГУ, 2018. - С. 149-152.
304. Алимурадов, А.К. Оценка психоэмоционального состояния человека на основе декомпозиции на эмпирические моды и кепстрального анализа речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Вестник Пензенского государственного университета. - 2018. - № 2 (22). -
C. 89-95.
305. Алимурадов, А.К. Повышение точности измерения частоты основного тона на основе оптимизации процесса декомпозиции речевых сигналов на эмпирические моды / А.К. Алимурадов, Ю.С. Квитка, П.П. Чураков, А.Ю. Тычков // Измерение. Мониторинг. Управление. Контроль. - 2018. - № 4 (26). - С. 53-65.
306. Alimuradov, A.K. A Method to Detect Human Psycho-Emotical Disorder Based on the Empirical Mode Decomposition and Formant Analysis of Speech Signals / A.K. Alimuradov, P.P. Churakov, A.Yu. Tychkov, I.A. Elfimova // 2018 Engineering and Telecommunication (EnT-MIPT) (Russia, Moscow, Nov. 15-16, 2018). - Moscow, 2018. - P. 179-183.
307. Alimuradov, A.K. Formant Analysis of Speech Signals Based on Empirical Mode Decomposition to Detect Human Psycho-Emotional Disorder / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2019 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus), (Russia, Saint Petersburg and Moscow, Jan. 28-31, 2019). - Saint Petersburg ; Moscow, 2019. - P. 1123-1128.
308. Alimuradov, A.K. Increasing Detection Efficiency of Psycho-Emotional Disorders Based on Adaptive Decomposition and Cepstral Analysis of Speech Signals / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2019 International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE), (Russia, Moscow, March 14-15, 2019). - Moscow, 2019. -5 p.
309. Алимурадов, А.К. Повышение эффективности обнаружения психоэмоциональных расстройств на основе адаптивной декомпозиции и кепстрального анализа речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Информационные технологии в науке и образовании. Проблемы и перспективы : сборник научных статей VI Всероссийской межвузовской научно-практической конференции (г. Пенза, 13 марта 2019 г.) / под редакцией Л.Р. Фионовой. - Пенза : Изд-во ПГУ, 2019. - С. 142-144.
310. Алимурадов, А.К. Способ обнаружения психоэмоционального расстройства человека на основе декомпозиции на эмпирические моды и формантного анализа речевых сигналов / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Вестник Пензенского государственного университета. -2019. - № 2 (26). - С. 69-80.
311. Alimuradov, A.K. Noise-Robust Algorithm for Determination of Prosodic Characteristics of Speech Signals in Automated Assessment System of Human Psycho-Emotional State / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2019 International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON) (Russia, Novosibirsk, Oct. 21-27, 2019). - Novosibirsk, 2019.- P. 0098-0103.
312. Алимурадов, А.К. Алгоритм определения формантной разборчивости речи для оценки психоэмоционального состояния человека / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Методы, средства и технологии получения и обработки измерительной информации («Шляндинские чтения - 2019») : материалы XI Международной научно-технической конференции с элементами научной школы и конкурсом научно-исследовательских работ для студентов, аспирантов и молодых ученых (г. Пенза, 28-30 октября 2019 г.) / под редакцией доктора технических наук, профессора Е.А. Печерской. - Пенза : Изд-во ПГУ, 2019. -С. 238-241.
313. Алимурадов, А.К. Способ автоматизированной сегментации речевых сигналов для определения временных паттернов естественно выраженных психоэмоциональных состояний / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Измерение. Мониторинг. Управление. Контроль. -2019. - № 3 (29). - С. 48-60.
314. Алимурадов, А.К. Помехоустойчивый алгоритм определения просодических характеристик речевых сигналов для систем оценки психоэмоционального состояния человека / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, Д.В. Артамонов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2019. - № 3 (51). - С. 3-16.
315. Алимурадов, А.К. Способ определения формантной разборчивости речи для оценки психоэмоционального состояния операторов систем управления с высокой степенью ответственности / А.К. Алимурадов,
А.Ю. Тычков, П.П. Чураков, Б.В. Султанов // Измерение. Мониторинг. Управление. Контроль. - 2019. - № 4 (30). - С. 58-69.
316. Alimuradov, A.K. Noise-Robust Method to Determine Speech Prosodic Characteristics to Assess Human Psycho-Emotional State in Free Motor Activity / A.K. Alimuradov, A.Y. Tychkov, P.P. Churakov // RusAutoCon 2019: Advances in Automation. Lecture Notes in Electrical Engineering / eds. by A. Radionov, A. Karandaev. - Springer, Cham, 2019. - Vol. 641. - P. 816-826.
317. Alimuradov, A.K. An Adaptive Speech Segmentation Algorithm to Determine Temporal Patterns of Human Psycho-Emotional States / A.K. Alimuradov, A.Y. Tychkov, A.V. Ageykin // RusAutoCon 2019: Advances in Automation. Lecture Notes in Electrical Engineering / eds. by A. Radionov, A. Karandaev. - Springer, Cham, 2019. - Vol. 641. - P. 879-890.
318. Алимурадов, А.К. Применение кепстрального анализа и декомпозиции на эмпирические моды в задачах обнаружения и оценки психоэмоциональных расстройств человека по речи / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Перспективные информационные технологии (ПИТ 2020) [Электронный ресурс] : труды Международной научно-технической конференции / под редакцией С.А. Прохорова. - Самара : Издательство Самарского научного центра РАН, 2020. - С. 7-11.
319. Алимурадов, А.К. Исследование вокализованной речи с помощью декомпозиции на эмпирические моды для обнаружения стрессовых эмоций человека / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков // Новые информационные технологии и системы: сборник научных статей по материалам XVII Международной научно-технической конференции (г. Пенза, 18-19 ноября 2020 г.). - Пенза : Изд-во ПГУ, 2020. - С. 121-125.
320. Alimuradov, A.K. Study of Voiced Speech Using Empirical Mode Decomposition to Detect Stressful Emotions in Human-Robot Interaction / A.K. Alimuradov, A.Yu. Tychkov, N.A. Makarova // 2020 4th Scientific School on Dynamics of Complex Networks and their Application in Intellectual Robotics (DCNAIR), (Russia, Innopolis, Sept. 7-9, 2020). - Innopolis, 2020. - P. 7-10.
321. Alimuradov, A.K. EMD-Based Voiced Speech Processing Method for Intelligent Recognition Systems of Stressed States in Humans / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2020 International Russian Automation Conference (RusAutoCon) (Russia, Sochi, Sept. 6-12, 2020). - Sochi, 2020. -P. 541-546.
322. Алимурадов, А.К. Применение метода декомпозиции на эмпирические моды для исследования вокализованной речи в задаче обнаружения стрессовых эмоций человека / А.К. Алимурадов, А.Ю. Тычков // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. - 2020. - № 3 (35). - С. 7-29.
323. Алимурадов, А.К. Способ выявления скрытых информативных параметров речи на основе декомпозиции на эмпирические моды для оценки психоэмоционального состояния человека / А.К. Алимурадов, А.Ю. Тычков, П.П. Чураков, Б.А. Порезанов, И.О. Стешкин, К.Е. Платонов, А.В. Баранова, Н.С. Бофанова // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. - 2022. - № 42. - С. 91-110.
324. Алимурадов, А.К. Новый подход к выявлению скрытых информативных параметров речевых сигналов на основе метода декомпозиции на эмпирические моды / А.К. Алимурадов, А.Ю., Тычков, П.П. Чураков, Д.С. Дудников // Перспективные информационные технологии (ПИТ 2022) [Электронный ресурс] : труды Международной научно-технической конференции / под редакцией С.А. Прохорова. - Самара : Издательство Самарского научного центра РАН, 2022. - С. 253-257.
325. Алимурадов, А.К. Особенности построения систем голосового управления для медицинских экзоскелетов расширенного функционала / А.К. Алимурадов, А.Ю. Тычков, И.И. Артёмов, М.Ю. Куликов // Качество. Инновации. Образование. - 2016. - № S2 (129). - С. 66-72.
326. Alimuradov, A.K. Enhancing Estimation Accuracy Of Psycho-Emotical State Of Operators Of Medical Exoskeletons As Intellectual Control Systems With High Degree Of Responsibility / A.K. Alimuradov, A.Yu. Tychkov // 2018 2nd School on Dynamics of Complex Networks and Their Application in Intellectual Robotics (DCNAIR) (Russia, Saratov, Oct. 8-10, 2018). - Saratov, 2018. - P. 6-8.
327. Staudacher, M. Fast fundamental frequency determination via adaptive autocorrelation / M. Staudacher, V. Steixner, A. Griessner, C. Zierhofer // EURASIP Journal on Audio, Speech, and Music Processing. - 2016. - P. 8.
328. Kumar, S. Efficient Time Domain Fundamental Frequency Estimation (Pitch Estimation) / S. Kumar, M. Jangra // International Journal of Electronics & Communication Technology (IJECT)( July - Sept 2015). - 2015. - Vol. 6, iss. 3.
329. Seo, E.-J. Feature Extraction Method for Predicting Depression by Frequency Domain Analysis / E.-J. Seo, K.-S. Hong // International Conference on Civil, Materials and Environmental Sciences (CMES 2015). - 2015. - P. 600-603.
330. Haraa, Y. Method for estimating pitch independently from power spectrum envelope for speech and musical signal / Y. Haraa, M. Matsumoto, K. Miyoshi // Journal of Temporal Design in Architecture and the Environment. -2009. - Vol. 9 (1). - P. 121-124.
331. Shahnaz, C. A Spectro-Temporal Algorithm for Pitch Frequency Estimation from Noisy Observations / C. Shahnaz, W. -P. Zhu, M. O. Ahmad // IEEE International Symposium on Circuits and Systems (ISCAS 2008) (18-21 May 2008). - P. 1704-1707.
332. Klapuri, A.P. Multiple Fundamental Frequency Estimation Based on Harmonicity and Spectral Smoothness / A.P. Klapuri // IEEE Transactions on Speech and Audio Processing. - 2003. - Vol. 11, № 6. - P. 804-816
333. Cheveigne, A. «YIN» a fundamental frequency estimator for speech and music / A. Cheveigne, H. Kawahara // The Journal of the Acoustical Society of America. - 2002. - Vol. 111, № 4. - P. 1917-1930.
334. Talkin, D. A Robust Algorithm for Pitch Tracking (RAPT) / D. Talkin // Chapter 14 in Speech Coding & Synthesis / eds. by W.B. Kleijn, K.K. Paliwan. Elsevier Science, 1995. - P. 495-518.
335. Camacho, A. A sawtooth waveform inspired pitch estimator for speech and music / A. Camacho, J.G. Harris // Journal of the Acoustical Society of America. - 2008. - Vol. 123 (4). - P. 1638-1652.
336. Alimuradov, A.K. Program Implementation of an Algorithm for Recognition of Speech Signals in the Labview Graphics Programming Environment / A.K. Alimuradov, A.Yu. Tychkov, M.V. Frantsuzov, P.P. Churakov // Measurement techniques. - 2015. - Vol. 58, iss. 9. - P. 965-969.
337. Schwartz, T.L. Depression: Treatment Strategies and Management (Medical Psychiatry Series) / T.L. Schwartz, T.J. Petersen. - Boca Raton : Informa Healthcare, 2009. - 339 p.
338. Алимурадов, А.К. Способ сегментации речевых сигналов на основе частотно-временного анализа / А.К. Алимурадов, Д.С. Дудников, И.И. Артёмов // Новые информационные технологии и системы (НИТиС-2022) : сборник научных статей по материалам XIX Международной научно-технической конференции (г. Пенза, 17-18 ноября 2022 г.). - Пенза : Изд-во ПГУ, 2022. - С. 2227.
339. Sharma, R. Characterizing glottal activity from speech using empirical mode decomposition / R. Sharma, S.R.M. Prasanna // 2015 21st National Conference on Communications (NCC) (27 February - 1 March, 2015). -Mumbai, India, 2015. - P. 1-6.
340. Alimuradov, A.K. Automation of empirical mode decomposition to increase efficiency of speech signal processing / A.K. Alimuradov, A.Yu. Tychkov, Yu.S. Kvitka // 2018 International Russian Automation Conference (RusAutoCon) (Sochi, Russia, 9-16 Sept. 2018). - Sochi : IEEE, 2018. - 6 p.
341. Alimuradov, A.K. Increasing detection efficiency of border mental disorders based on adaptive decomposition and cepstral analysis of speech signals /
A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov, A.P. Zaretskiy, I.B. Prokhorov, K.S. Mityagin // Журнал радиоэлектроники. - 2019. - № 6. - С. 9.
342. Alimuradov, A.K. Methods to Improve the Efficiency of Recognition of Speech Signals in Voice Control Systems / A.K. Alimuradov, F.Sh. Murtazov // Measurement techniques. - 2015. - Vol. 58, iss. 10. - P. 1107-1112.
343. Abu-Shikhah, N. A novel pitch estimation technique using the Teager energy / N. Abu-Shikhah, M. Deriche, // International Symposium on Signal Processing and Its Applications (ISSPA) (IEEE Cat. No.99EX359) (Aug. 22-25, 1999). - Brisbane, Queensland, Australia, 1999. - Vol. 1. - P. 135-138.
344. Kvedalen, E. Signal Processing Using the Teager Energy Operator and Other Nonlinear Operators : PhD dissertation, Department of Informatics / Kvedalen E. - Oslo : University of Oslo, 2003. - 121 p.
345. Жуйков, В.Я. Алгоритм классификации сегментов речевого сигнала / В.Я. Жуйков, А.Н. Харченко // Электроника и Связь. Тематический выпуск «Электроника и нанотехнологии». - 2009. - Ч. 1, № 2-3. - С. 130-137.
346. Bahoura, M. Wavelet speech enhancement based on the teager energy operator / M. Bahoura, J. Rouat // IEEE Signal Processing Letter. - 2001. - Vol. 8, № 1. - P. 10-12.
347. Le, D. Emotion recognition from spontaneous speech using Hidden Markov models with deep belief networks / D. Le, E.M. Provost // 2013 IEEE Workshop on Automatic Speech Recognition and Understanding (Olomouc, Czech Republic, 8-12 December 2013). - Olomouc : IEEE, 2013. - P. 216-221.
348. Vlasenko, B. Tuning Hidden Markov Model for Speech Emotion Recognition / B. Vlasenko, A. Wendemuth // German annual conference for acoustics - DAGA 2007 (Stuttgart, Germany, 19-22 March, 2007). - Stuttgart : Druckhaus Galrev, Berlin, 2007. - P. 317-318.
349. Hariharan, M. Improved Emotion Recognition Using Gaussian Mixture Model and Extreme Learning Machine in Speech and Glottal Signals / M. Hariharan, K. Polat, S. Yaacob // Mathematical Problems in Engineering. - 2015. -№ 6. - P. 1-13.
350. Patel, P. Speech Emotion Recognition System Using Gaussian Mixture Model and Improvement proposed via Boosted GMM / P. Patel, A.A. Chaudhari, M.A. Pund, D.H. Deshmukh // International Conference on Science & Engineering for Sustainable Development (New York, USA, 18-20 September 2017). - New York, 2017. - P. 56-64.
351. Nayak, B. Speech Emotion Recognition using Different Centered GMM / B. Nayak, M. Madhusmita, D.K. Sahu // International Journal of Advanced Research in Computer Science and Software Engineering. - 2013. - № 3 (9). -P. 646-649.
352. Chavhan, Y. Speech Emotion Recognition Using Support Vector Machines / Y. Chavhan, M. Dhore // International Journal of Computer Applications. - 2010. - № 1 (20). - P. 6-9.
353. Raj, K.M. Speech Emotion Recognition Using Support Vector Machine / K.M. Raj, S. Gothane, Ch. Aitha, M.A. Akshay, B. Vanaparthi // International journal of creative research thoughts. - 2021. - № 9 (5). - P. i682-i686.
354. Chaudhary, R. Speech Emotion Recognition Using Neural Network / R. Chaudhary, S. Saraswat, S. Chaturvedi, P. Naregalkar // International Journal of Scientific Research in Engineering and Management. - 2020. - № 4 (8). - 5 p.
355. Lu, Ch. Speech Emotion Recognition via an Attentive Time-Frequency Neural Network / Ch. Lu, W. Zheng, H. Lian, Y. Zong, Ch. Tang, S. Li, Y. Zhao // IEEE Transactions on Computational Social Systems. - 2022. - № 9. -P. 1-10.
356. Singh, A. Speech Emotion Recognition Using CNN / A. Singh, K.K. Srivastava, H. Murugan // International Journal of Psychosocial Rehabilitation. -2020. - № 24 (8). - P. 2408-2416.
357. Falahzadeh, M.R. 3D Convolutional Neural Network for Speech Emotion Recognition With Its Realization on Intel CPU and NVIDIA GPU / M.R. Falahzadeh, E.Z. Farsa, A. Harimi, A. Ahmadi, A. Abraham // IEEE Access. -2022. - № 10. - P. 112460-112471.
358. Alimuradov, A.K. RNN-Based Method for Classifying Natural Human Emotional States from Speech/ A.K. Alimuradov, A.Yu. Tychkov, D.S. Dudnikov, M.A. Tyurin, M.I. Yuskaev, M.G. Myasnikova, D.S. Moiseev // 2023 25rd International Conference on Digital Signal Processing and its Applications (DSPA), (Russia, Moscow, March 29-30, 2023). - Moscow, 2023. - 6 p.
359. Wolfram Reseach [Электронный ресурс]. - URL: https://www.wolfram.com/ (дата обращения: 02.03.2023).
360. Maplesoft [Электронный ресурс]. - URL: https://maplesoft.com/ (дата обращения: 02.03.2023).
361. Parametric Technology Corporation [Электронный ресурс]. - URL: https://www.ptc.com/ (дата обращения: 02.03.2023).
362. MathWorks [Электронный ресурс]. - URL: https://www.mathworks.com/ (дата обращения: 02.03.2023).
363. Dassault Systemes [Электронный ресурс]. - URL: https://www.scilab.org/ (дата обращения: 02.03.2023).
364. Alimuradov, A.K. A Method for Automated Segmentation of Speech Signals to Determine Temporal Patterns of Naturally Expressed Psycho-Emotional States / A.K. Alimuradov, A.Yu. Tychkov, A.V. Ageykin // 2019 International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON) (Russia, Novosibirsk, Oct. 21-27, 2019). - Novosibirsk, 2019. - P. 0093-0097.
365. Alimuradov, A.K. A method to Determine Speech Intelligibility for Estimating Psycho-Emotional State of Control System Operators with a High Degree of Responsibility / A.K. Alimuradov, A.Yu. Tychkov, P.P. Churakov // 2019 International Siberian Conference on Control and Communications (SIBCON) (Russia, Tomsk, April 18-20, 2019). - Tomsk, 2019. - 6 p.
366. Tychkov, A.Yu. Adaptive Signal Processing Method for Speech Organ Diagnostics / A.Yu. Tychkov, A.K. Alimuradov, P.P. Churakov // Measurement techniques. - 2016. - Vol. 59, № 5. - P. 485-490.
367. Python 3 [Электронный ресурс]. - URL: https://www.python.org/ (дата обращения: 02.03.2023).
368. Система речевой аналитики «SVQA» [Электронный ресурс]. -URL: https://svqa.ru (дата обращения: 20.02.2023).
369. Подсистема автоматической оценки качества «Smart Logger» многоканальной системы регистрации телефонных вызовов и речевых сообщений «НЕЗАБУДКА II» [Электронный ресурс]. - URL: https://www.speechpro.ru (дата обращения: 20.02.2023).
370. Профессиональная система диагностики голоса и речи «lingWAVES» [Электронный ресурс]. - URL: https://www.wevosys.com (дата обращения: 20.02.2023).
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.