Алгоритмы обработки речевых сигналов и классификации психоэмоционального состояния человека на выходе каналов передачи речевой информации при действии мешающих факторов тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат наук Лукьянов, Дмитрий Игоревич
- Специальность ВАК РФ05.12.04
- Количество страниц 180
Оглавление диссертации кандидат наук Лукьянов, Дмитрий Игоревич
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1 ВЛИЯНИЕ ПСИХОЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА НА ПАРАМЕТРЫ РЕЧЕВОГО СИГНАЛА
1.1 Вводный замечания
1.2 Обоснование модели классификации психоэмоционального состояния человека
1.3 Речевой материал
1.4 Исследование статических параметров речевого сиг нала с целью выявления психоэмоционального состояния человека
1.4.1 Особенности использования статических параметров речевого сигнала
1.4.2 Исследование зависимости изменения основных гармонических составляющих спектра речевого сигнала при различных психоэмоциональных состояниях человека
1.4.3 Исследование зависимостей параметров речевого сигнала во временной области от психоэмоционального состояния человека
1.4.4 Исследование зависимости изменения мел-кепстральных коэффициентов при различных психоэмоциональных состояниях человека
1.4.5 Исследование зависимости изменения коэффициентов линейного предсказания и их производных при различных психоэмоциональных состояниях человека
1.4.6 Исследование зависимости изменения параметров фазовых портретов при различных психоэмоциональных состояниях человека
1.5 Исследование динамических параметров речевого сип ьала с целыо выявления признаков психоэмоционального состояния человека
1.6 Оценка наиболее значимых параметров речевого сигнала с целью
классификации психоэмоционально! о сосюяния чьловгка
1.6.1 Оценка значимости статических и динамических параметров речевого сигнала при классификации психоэмоционального состояния человека
1.6.2 Оценка значимости выбранных параметров речевого сигнала с использованием метода группового учета аргументов
1.7 выводы
2 ОЦЕНКА ВЛИЯНИЯ РАЗЛИЧНЫХ МЕШАЮЩИХ ФАКТОРОВ В КАНАЛАХ ПЕРЕДАЧИ ИНФОРМАЦИИ НА ЗНАЧИМЫЕ ПАРАМЕТРЫ РЕЧЕВОГО СИГНАЛА С ЦЕЛЫО ВЫЯВЛЕНИЯ ПСИХОЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ ЧЕЛОВЕКА
2.1 вводныг замечания
2.2 опредглениг необходимой полосы частот речевого сиг нала, содержащей признаки психоэмоционально! о состоя11ия человека
2.3 иссл! дование возмож1юс1 и оценки психоэмоционально! о состояния человека при действии акустических помех
2.3.1 В. шяние акустических по мех на речевой сигна /. и меклций эмогрюна 1ьный окрас
2.3.2 Оценка возможности использования алгоритма Хургина-Яковлева дчя повышения восприятия передаваемых эмоциональных составчяклцихречевого сигнача
2.4 Исследование влияния параметров каналов передачи информации па эмоциональную составляющую речгвого сиги\ла
2.5 иссльдование влияния асинхронного маскирования речи на эмоцио! 1албную сос 1 авляющую речевого сигнала
2.6 Выводы
3 АНАЛИЗ И ОБОСНОВАНИЕ РЕАЛИЗАЦИИ АЛГОРИТМА КЛАССИФИКАЦИИ ПСИХОЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ
ЧЕЛОВЕКА НА ВЫХОДЕ КАНАЛОВ ПЕРЕДАЧИ РЕЧЕВЫХ СИГНАЛОВ
3.1 Вводные замечания
3.2 Структурная схема алгоритма классификации
психоэмоционального состояния человека на выходе каналов передачи информации
3.3 Исследование алгоритма снижения влияния акуст ических помбх
и защиты речев01 о сигнала на основе представления ХУР1 ина-
Яковльвл
3.3.1 Блок-схема алгоритма па основе представления Хургина-Яковлева
3.3.2 Экспериментальные исследования алгоритма
3.4 Исследование алгоритма определения значимых параметров речевого сигнала и классификации психоэмоционального состояния человека
3.4.1 Блок-схема алгоритма определения значимых параметров речевого сигнала и классификации психоэмоционального состояния человека
3.4.2 Экспериментальные исследования алгоритма
3.5 Al 1ализ возможности аппаратной реализации алгоритма классификации психоэмоционального состояния человека на выходе каналов передачи информации
3.5.1 Оценка вычислительных затрат
3.5.2 Анализ аппаратной реализации алгоритма классификации психоэмоционального состояния человека на выходе каналов передачи информации
3.6 Выводы
ЗАКЛЮЧЕНИЕ
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
150
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А. КОПИИ АКТОВ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ
Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Адаптивные системы обработки и передачи речевых сигналов в условиях акустических помех и шумов в радиоканале2023 год, доктор наук Дмитриев Владимир Тимурович
Алгоритмы поиска ключевых слов в радиотехнических устройствах обработки речевой информации, устойчивые к воздействию мешающих факторов2013 год, кандидат наук Баландин, Иван Васильевич
Исследование и разработка алгоритмов обработки речевой информации на основе представления Хургина-Яковлева в радиотехнических устройствах2006 год, кандидат технических наук Дмитриев, Владимир Тимурович
Модели и методы анализа и обработки речевого сигнала в системах связи2018 год, кандидат наук Афанасьев, Андрей Алексеевич
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Введение диссертации (часть автореферата) на тему «Алгоритмы обработки речевых сигналов и классификации психоэмоционального состояния человека на выходе каналов передачи речевой информации при действии мешающих факторов»
ВВЕДЕНИЕ
Актуальность темы. Разработка алгоритмов классификации психоэмоционального состояния (IDC) человека является одной из наиболее сложных задач в области обработки речевой информации. Алгоритмы классификации ПЭС целесообразно применять в устройствах постобработки PC, а также системах передачи и отображения медико-биологической информации. К данному классу устройств можно отнести средства интерактивного взаимодействия человека и IBM, криминалистической фоносконии, медицинской диагностики, в информационно-управляющих комплексах и др. Кроме того, большой интерес к системам удаленной оценки 1 ГЭС человека может проявлять психосоматическое направление в медицине, позволяющее посредством анализа эмоций повысить точность диагностирования таких заболеваний, как бронхиальная астма, синдром раздраженной толстой кишки, эссеициальиая артериальная гипертензия, головная боль, напряжения, головокружения, вегетативные расстройства типа панических атак и прочес.
В настоящее время существует несколько способов выявления ПЭС человека: посредством электрического сопротивления кожи и сердечно-сосудистой активности человека |1|; с использованием мимики лица и движений тела |2|; посредством обработки речевого сигнала (PC).
Анализ ПЭС человека посредством электрического сопротивления кожи и сердечно-сосудистой активное! и позволяет с достаточной точность определять состояние испытуемого, в том числе осуществлять оценку достоверности слов человека. К существенному недостатку этого метода можно отнесш необходимость использования контактных датчиков, прикрепляемых к телу человека, что не всегда является возможным.
В последние годы использование мимики лица и движений тела для оценки ПЭС человека получило широкое распространение, чю привело к серьезному развитию классификационных моделей. В то же время, данный метод также имеет
ряд ограничений, а именно: необходимость апфасного расположения лица испытуемого, высокое качество видеоизображения, широкая полоса частот и высокая скорость передачи информации при осуществлении удаленной оценки 1 ЮС человека.
В случае обработки РС анализ 1ОС человека позволяет избежать недостатков, присущих двум другим методам, так как для функционирования этого метода необходим только микрофон.
В ряде основных проблем, существующих при разработке алгоритмов классификации ПЭС человека па основе РС, наиболее актуальными являются:
1 Создание объективной базы РС, имеющих эмоциональный окрас. Сложность решения этой проблемы обуславливается большим разнообразием разговорных языков, каждый из которых характеризуется своей эмоциональной окраской, а также спонтанностью проявления реальных ЮС человека. Кроме того, существуют морально-этические аспекты создания объективной речевой базы I ГЭС человека.
2 Разработка единой модели классификации ПЭС человека. Эта проблема является актуальной для всех известных методов оценки 1 Г)С человека, так как в настоящее время отсутствует точная терминология и описание эмоциональной окраски речи человека.
3 Определение значимых параметров РС, которые могут однозначно характеризовать ту или иную эмоцию, и при этом были бы нечувствительны к другим составляющим речи: смысловому содержанию фразы, индивидуальным особенностям голоса, биофизическим характеристикам дик тора.
В настоящее время возрос интерес к определению ПЭС человека при анализе РС па выходе каналов передачи информации (КПИ) По этой причине требуется проведение отдельных исследований оценки влияния КПИ на эмоциональную окраску РС с целыо определения вероятности правильной классификации 1 ОС человека. Необходимо отметить, что па РС в КПИ действ}ют различные мешаю-
щие факторы в виде акустических помех, искажений, а также шумов аппаратуры.
Таким образом, актуальны задачи обоснования параметров классификации ПЭС человека на основе РС, исследования влияния КИИ на эмоциональную окраску РС, а также разработка алгоритма классификации ПЭС человека на основе анализа РС па выходе КИИ при действии мешающих факторов.
Степень ра?рабоганносги темы. Впервые вопрос об оценке ПЭС человека возник в 1872 году в результате исследований Ч. Дарвина [3]. Впоследствии интерес к изучению этого вопроса усиливался из года в год. Дальнейшее его развитие позволило получи 1Ь первые модели, позволяющие классифицировать ПЭС человека посредством анализа РС |4]. Предложенные модели характеризовались низкой вероятностью правильной классификации ПЭС, а также малым числом анализируемых эмоций, что обуславливалось низкими характеристиками доступных па тот момент средств обработки РС.
В настоящее время проведено большое количество исследований в данной области. Наиболее существенный вклад в развитие методов оценки ПЭС человека посредством анализа РС внесли работы отечественных ученых В.П. Морозова, Е.П. Ильина, Э.Л. Пушикян, Т.П. Ушаковой, II.И. Жипкина |5...9], а также работы зарубежных исследователей В. Вупд1а, К. Шерера, О. Фрая, К. Изарда, Ф. Счмийдера |4,10...13|.
Цель и задами работы. Основной целью диссертационной рабопл являемся разработка алгоритма классификации ПЭС человека на основе анализа РС па выходе КИИ при действии мешающих факторов.
Поставленная цель работы требует решения следующих задач:
1 Обоснования модели классификации ПЭС человека на основе обобщенной эмоциональной плоскости.
2 Создания базы РС, имеющих эмоциональный окрас, для обеспечения устойчивости алгоритмов определения значимых для оценки ПЭС человека параметров.
3 Определения требуемой полосы частот КГ1И, содержащей эмоциональную составляющую РС.
4 Исследования влияния характерисшк современных КИИ и мешающих факторов на эмоциональную составляющую РС в интересах определения возможности оценки НЭС человека па выходе К11И.
5 Исследования влияния параметров алгоритмов асинхронного маскирования речи (АМР) на эмоциональную составляющую РС.
6 Обоснования структурной схемы алгоритма классификации I ГЭС человека па основе анализа РС на выходе КИИ.
7 Определения требуемых вычислительных мощностей для реализации алгоритма классификации ПЭС человека па выходе Ю ГИ.
Научная новизна. В рамках диссертационной работы были получены следующие новые научные результаты:
1 Определены новые значимые параметры РС, позволяющие классифицировать ПЭС человека, которыми являются коэффициенты линейного предсказания (ЛИ), полученные на основе автокорреляционного метода, коэффициенты импульсной характеристики прямого фильтра и параметры фазовых портретов (ФИ).
2 Предложено использование метода группового учета аргументов (МГУЛ) для оценки значимости параметров РС в случае классификации 11ЭС человека.
3 Предложено использование модифицированной фонетической функции речи А.А. Пирогова для оценки значимости статических и динамических параметров РС с точки зрения классификации 1 ПС человека.
4 Проведено исследование влияния акустических помех на эмоциональную составляющую РС.
5 Проведены исследования представления Хургипа-Яковлева при использовании производных первого - третьего порядка и показана эффективность представления при передаче эмоциональной составляющей РС.
6 Проведены исследования влияния характеристик КПП па '.эмоциональную составляющую РС, показывающие необходимость их учета при классификации ПЭС человека.
7 Проведены исследования влияния алгоритмов АМР на эмоциональную составляющую РС.
8 Разработан алгоритм классификации ПЭС человека па основе анализа РС на выходе КПП, учитывающий особенности передающего тракта и других мешающих факторов.
Теоретическая и практическая значимость работы. Представленные в работе алгоритмы классификации ПЭС человека на основе анализа РС могут быть использованы в таких радиотехнических устройствах, как системы передачи и хранения речевой информации, системы голосового управления, информационно-справочные системы, системы автоматической идентификации и верификации информанта по голосу, системы криминалистической фоноскопии, системы конфиденциального доступа и закрытия речевой информации, а также в медицинских системах диагностики эмоционального состояния человека, системах открытого образования для лиц с ограниченными возможностями здоровья и т.д. Результаты диссертационной работы нашли применение в разработках открытого акционерного общества «Российские космические системы» (ОАО «РКС») и учебном процессе ФГБОУ В ПО «РГР'ГУ», что подтверждено соответствующими актами.
Методология и методы исследования. В работе использовались методы статистической радиотехники и математической статистики, распознавания образов, динамического программирования, вычислительной математики, а также новые достижения в области цифровой обработки речевой информации. Данные теоретические методы сочетались с экспериментальными исследованиями па основе имитационного моделирования разработанных алгоритмов.
Положения, выносимые на защиту.
1 Применение коэффициентов ЛИ, полученных на основе автокорреляци-
онного метода; коэффициентов импульсной характеристики прямого фильтра и параметров Ф11 РС, позволяет повысить вероятность правильной классификации ПЭС человека при том же числе параметров в среднем на 0,08 или снизить необходимое число параметров в 1,7 раза по сравнению с известными алгоритмами.
2 Алгоритм классификации ПЭС человека па основе анализа РС на выходе К11И, обеспечивающий вероятность правильной классификации 11ЭС человека по шкале «удовольствие-неудовольствие» до 0,93 и по шкале «раеелабление-иапряжепие» до 0,83.
3 Алгоритм снижения влияния акустических помех и защиты эмоциональной составляющей РС па основе представления Хургина-Яковлева, обеспечивающий выигрыш в качестве восстановленного сигнала в среднем па 0,5 балла и увеличивающий вероятность правильной классификации ПЭС в среднем на 0,04 при действии акустических помех.
Достоверность. Достоверность результатов и выводов, полученных в диссертационной работе, обосновывается корректностью численных экспериментов, качественным и количественным сопоставлением с известными положениями теории обработки и восприятия РС.
Апробации работы. Результаты работы докладывались па следующих конференциях:
1 Семнадцатая международная научно-техническая конференция «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань, 2012.
2 Двадцать четвертая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы». Рязань, 2012.
3 Пятьдесят девятая студенческая научно-техническая конференция. Рязань, 2012.
4 Семнадцатая всероссийская научно-техническая конференция студентов,
молодых ученых и специалистов. Рязань, 2012.
5 Вторая итоговая конференция молодых ипповаторов по программе «Умник» в Рязанской области. Рязань, 2012.
6 Двадцать пятая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы». Рязань, 2012.
7 Десятая международная научная конференция «Перспективные технологии в средствах передачи информации». Владимир, 2013.
8 Шестая международная научно-техническая конференция «Космонавтика. Радиоэлектроника. Геоипформатика». Рязань, 2013.
9 Восемнадцатая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях». Рязань, 2013.
10 Шестнадцатая международная конференция «Цифровая обработка сигналов и се применение - ОЯРЛ-2014». Москва, 2014.
11 Семнадцатая международная ¡елскоммуникационпая конференция молодых ученых и С1удеп'юв «Молодежь и наука». Москва, 2014.
12 Международная конференция «Радиоэлекфонпые устройства и системы для ипфокоммупикационпых технологий - Рг)УС-2014». Москва, 2014.
13 Четвертая всероссийская научно-техническая конференция «Информационно-измерительные и управляющие системы военной техники». Владимир, 2014.
14 Девятнадцатая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях». Рязань, 2014.
15 Двадцать седьмая всероссийская научно-техническая конференция студентов, молодых ученых и специалисюв «Биотехнические, медицинские и экологические системы и комплексы». Рязань, 2014.
16 Восемнадцаыя международная телекоммуникационная конференция молодых ученых и епдетов «Молодежь и наука». Москва, 2015.
Публикации. По iсме диссертации опубликовано 20 работ: 3 статьи в научно-юхпических журналах, рекомендованных ВАК. 1 статья в межвузовском сборнике трудов п 10 тезисов док ia юв на конференциях.
("ipvKiypa и обьем раб<пы. Диссертационная работа сосюш из введения, трех 1лав. заключения. списка литературы из 179 наименований и одного приложения Диссертация изложена на 180 страницах, из коюрых 133 страницы осноз-HOIо icKCia. 26 таблиц и 70 рисунков.
Ь.кподариос!и. Автор выражает искреннюю признательность своему научному руководителю д. т. н. проф. Кириллову С. II. за неоценимую помощь и oipoMiiyio моральную по тдержку. оказанную в процессе работы над диссертацией. Авюр также б.кио шрш своих коллет. аспирапюв и сотрудников кафедры рл-диоуправ юння и связи за высказанные замечания, содействие и помощь в процессе работы и оформления тиссерищии. Выражаю особую благодарность своим родным и близким за предоставлениую возможность заниматься научной дет-TCTbiHvibio. Хочу выразить отдельную бла! одариос i ь моей cynpyi е за моральпу о поддержку и терпение.
1 ВЛИЯНИЕ ПСИХОЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧЕЛОВЕКА НА ПАРАМЕТРЫ РЕЧЕВОГО СИГНАЛА
1.1 Вводные замечания
РС несет в себе большое количество информации, которая необходима человеку для осуществления коммуникации и передачи сообщений. 11ри этом в современных системах речевой связи основное внимание уделяется прямой информации, передаваемой от человека к человеку. В то же время РС включает в себя не только прямую информацию, по и косвенную, которая способна в полной мере раскрыть смысловое содержание сообщения, а также оценить общее НЭС говорящего человека [ 14|.
В качестве одного из путей определения 1 ГЭС человека целесообразно использовать РС, так как только такой подход позволяет получить необходимую информацию бесконтактным путем па больших расстояниях па выходе КИИ. Преимуществом использования бесконтактного метода является отсутствие внешних датчиков, ограничивающих естественное поведение человека. Кроме того, при необходимости, микрофон может быть скрыт от объекта анализа, что дополнительно позволяет создать ситуацию, при которой человек ведет себя более естественно 1151.
Па сегодняшний день не существует единой системы оценки ПЭС человека, а также четких определений всех возможных эмоциональных состояний \6\. В то же время попытки определить параметры, описывающие изменение ПЭС, осуществляются уже длительное время, и на сегодняшний день существует большое число исследований в этой области 116...22].
Для определения наиболее значимых параметров РС в интересах классификации ПЭС человека в первой главе работы необходимо решить следующие задачи:
1 Обосновать модель классификации ПЭС человека с целью наиболее точного описания определенных эмоциональных сосюяний.
2 Составить необходимый речевой материал для наиболее эффективного исследования влияния ПЭС человека па параметры РС.
3 Исследовать статические параметры РС с целыо выявления I ЮС человека.
4 Исследовать динамические параметры РС с пслыо выявления I Г)С человека.
5 Оцепить наиболее значимые параметры РС с целыо классификации ПЭС человека.
1.1.1 Обоснование модели классификации психоэмоционального
состояния человека
При выявлении ПЭС человека важным является обеспечение максимальной точности оценивания параметров РС и обоснование алгоритма классификации различных эмоций. Существенную неопределенность в решение данного вопроса вносит тот факт, что на сегодняшний день не существует' единой классификации и точных определений большинства эмоций человека [6]. В связи с эшм целесообразно обосновать одну из известных в психологии классификаций 1 ОС человека, при этом от выбранной базы будет зависеть итоговая вероятность правильной классификации ПЭС человека в алгоритме.
Для эффективной оценки текущего ПЭС человека важным являемся деление эмоций по типам, которые определяют натуральность эмоций, а также возможность их контролирования. В 2003 году Шерером [23) были предложены следующие типы эмоционального проявления человека: реальные, спровоцированные и актерские эмоции.
Реальные эмоции представляют собой тин эмоций, при котором человек под действием внешней обстановки или внутренних переживаний пребывает в том или ином ПЭС |23]. Преимуществом этого типа эмоций является их полная достоверность, но в то же время создание необходимого набора реализаций существенно усложнено ввиду спонтанности появления таких эмоций. Этт недостаток
объясняется тем, что и реальных условиях человек не знает, когда будет переживать то или иное эмоциональное состояние, что в свою очередь существенно усложняет процесс записи необходимых 1Г)С конкретного человека. В результате, итоговый набор эмоциональных фраз, как правило, получается неполным, что не позволяет достоверно оценить влияние исследуемых параметров.
Спровоцированные эмоции являются промежуточным типом между реальными и актерскими и представляют собой эмоции человека, вызванные заранее спроектированной внешней обстановкой [23]. Под заранее спроектированной обстановкой могут пониматься диалог, музыка, резкие звуки и другое |24...27]. При этом важным условием является неосведомленность испытуемого о них заранее. Такой подход, с одной стороны, позволяет получить более правдоподобный набор эмоций человека, а с другой стороны - лучше его контролировать. Недостатком данного подхода является то, что, как правило, эмоциональная реакция испытуемого является более слабой по сравнению с реальными эмоциями [5,231. В результате чего, при использовании данного типа эмоций нецелесообразно проводить исследования с ярко выраженными ГЮС человеком.
Актерские эмоции представляют собой тип эмоций, при котором человек самостоятельно пытается изобразить то или иное заданное Г Г") С [23,51. При этом человек не обязательно может являться профессиональным актером, что в свою очередь влияет на итоговую достоверность. Преимуществом актерских эмоций является то, что их легко контролировать и создавать необходимые наборы реализаций. В то же время, этот тип эмоций характеризуется более ярким окрасом по сравнению с реальными эмоциями, т.к. актеры, в погоне за большей достоверностью, часто вкладывают слишком много чувств, что подтверждено исследованиями, показанными в |23].
В дальнейшем в данной работе используются спровоцированные и реальные эмоции. Такой выбор обусловлен повышением достоверности исследований при умеренной сложности создания наборов РС, имеющих эмоциональный окрас. Спровоцированные эмоции используются на начальном этапе для выявления зпа-
чимых параметров и создания рабочей гипотезы, а реальные эмоции для уточнения полученных результатов на первом этапе и проверки созданной гипотезы.
Для определения принадлежности ЮС человека к той или иной эмоциональной группе используется большое число классификаций, обусловленных различными подходами, которые в свою очередь часто несовместимы между собой |6]. Основной вклад в обоснование классификаций эмоций внесли Т. Брауп, Д. Стюарта, И. Кант, Г. Спенсер, А. Нэп, В. Вундт, О. Титченер, У. Джемс, 11. 1к-ман, К. Изард, Р. Плутчик и др. |4,10,23,28...30]. Среди отечественных ученых можно выделить работы Е. П. Ильина, В. П. Морозова, Л. В. Благопадежипой, П. К. Анохина и др. [5,6,31,32]. Каждый исследователь, как правило, предлагал свой набор эмоций, отличающийся общим количеством возможных эмоциональных состояний, а также взаимосвязями между ними. При этом можно выделить два основных направления: жесткая классификация на фиксированное число 1 ОС и более мягкая классификация, подразумевающая наличие только эмоциональных областей, содержащих большое (по мнению В. Вупдта более 50 ООО |10|) количество эмоций. При этом первый подход предполагает деление эмоций на первичные (базисные) и вторичные. В данном подходе под вторичными подразумеваются комбинации двух или нескольких первичных эмоций, а также тех эмоций, которые имеют глубокие филогенетические корни, имеющиеся не только у человека, по и у животных |6,33].
В данной работе предлагается использовать второй подход, подразумевающий наличие только эмоциональных областей. Такой выбор обусловлен тем, что отдельные эмоции в виду отсутствия Iочных определений сложно расположить па единой плоскости или в пространстве, что в свою очередь затрудняет их классификацию машинным путем. Кроме того, при создании классификатора, основанном на конечном количестве ГЮС, гораздо сложнее осуществить модернизацию алгоритма в случае изменения набора ЮС человека, что обуславливается проведением дополнительных исследований для правильной интеграции новых эмоций.
Исходя из изложенного выше в данной работе за основу был взят подход
основоположника научной психологии В. Вундта, который считал, что число эмоций (по В. Вупдту - оттенков эмоционального тона ощущений) настолько велико, что язык пе располагает достаточным количеством слов для их обозначения [10]. Результатом такого подхода является модель, представленная па рисунке 1.1.
Рисунок 1.1 - Эмоциональная модель В. Вуидга
Модель, представленная па рисунке 1.1, охватывает очень большое количество эмоциональных состояний и описывает только эмоциональные векторы. Недостатком этой модели с точки зрения применения к автоматической классификации ПЭС человека является отсутствие обозначений по шкалам эмоций, что затрудняет интерпретацию уровня эмоционального окраса. Исходя из этого, а также из известных |6] степеней эмоциональности но шкалам, предложенным В. Вундтом, целесообразно представить плоскость основных эмоций в следующем виде (рисунок 1.2). Преимущество данной модели заключается в меньшем количестве подплоскостей при том же числе охватываемых эмоциональных состояний.
Расслабление
/
/
I
|Ьешепаво 1нс
He);
довольствие
\
\
\
Bojmn 1цс-
Лффск l и hi юс a >c типце
Bocropi
\
\
\
\
\
Ь.иженс i во
I Iac.U/K, ic-нис
\
> довольствие
11ИС / L
—---UOKy—
Ьоя ли,
t'Tpj\
Ужас
Ра юс и,
JIllKUlMlllk'
l>\ fie I li() .
/
/
Напрнжсние
Рисунок 1.2 — Используемая эмоциональная плоскость
Такая модификация плоскости возможна в результате преобразования шкалы «Успокоение-Возбуждение» в качестве меры эмоциональности по двум другим шкалам. Исходя из равнозначности указанных эмоций в данной работе выделим по три эмоциональные области по каждой из осей. В результате такого разделения появляется возможность использовать устоявшиеся термины 1ПС человека, такие как «радость», «ликование», «страх», «гнев» и др. Оти термины существенно облегчают субъективное восприятие 1 ПС человека аудиторами, при этом не исключая возможности автоматической классификации 1ПС па основе предложенной эмопиональпой плоскости.
Под состоянием спокойствия в данной модели подразумевается некая область на плоскости, в которую входит не только пулевая точка, по и область «настроение» [34 J, соответствующая слабым изменениям ПЭС человека. Такой выбор обусловлен высокой сложностью оценки слабых эмоциональных измене-
ний, а также созданием необходимого набора реализаций. В связи с этим в данной работе термин «спокойствие» будет употребляться в более широком смысле, учитывающим указанную выше особенность.
Дальнейшие исследования проводились с использованием названий эмоций, отмеченных на рисунке 1.2, что объясняется более удобным описанием исследуемых эмоциональных состояний.
1.2 Речевой материал
Для точной классификации ЮС человека необходимо создание качественной речевой базы. Существующие па сегодняшний день наборы |35], находящиеся в открытом доступе, записаны преимущественно па английском и немецком языках. Известно |36], что в различных языках и у разных народов эмоции проявляются по-разному. Например, англичане являются более сдержанными па эмоции, что в свою очередь отражается на их языке общения, в то время как итальянцы являются более импульсивным пародом [37]. Такие отличия существенно затрудняют исследования ЮС па других языках и подразумевают использовании более объемной речевой базы. Кроме го го, использование гоювого набора эмоциональных записей ограничивает возможность оценки характеристик самих дикторов и предлагает только набор фраз.
В связи с этим в данной работе была использована собственная речевая база, записанная на русском языке, включающая в себя два набора эмоций: спровоцированных и естественных. При этом у всех дикторов, принимавших участие в исследовании, русский язык являлся родным, а также отсутствовали заметные дефекты речи. Согласно тинам эмоций, онисанпых в пункте 1.1.1, в работе использовались два набора речевых реализаций.
Первый набор включал в себя фразы, отражающие спровоцированные эмоции, с участием 12 дикторов (6 мужчин и 6 женщин). Дикторы, участвовавшие в подготовке этого набора, не знали целей исследования до момента окончаний всех сессий записи, что повышало вероятность получения более правдоподобных
Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Метод и алгоритмы выделения частоты пульса из речевого сигнала в условиях отсутствия априорной информации о дикторе2020 год, кандидат наук Полешенков Дмитрий Дмитриевич
Исследование и разработка эффективного метода оценки и способа повышения качества передачи речевой информации по сети мобильной связи Палестинского региона2013 год, кандидат наук Елбхаиси Махмуд
Исследование мультимодальных алгоритмов биометрической идентификации на основе методов цифровой обработки речевых сигналов и изображений2022 год, кандидат наук Стефаниди Антон Федорович
Биотехническая система мониторинга эмоций человека по речевым сигналам и электроэнцефалограммам2015 год, кандидат наук Сидоров, Константин Владимирович
Исследование и разработка методов повышения эффективности асинхронного маскирования речевых сигналов2001 год, кандидат технических наук Малинин, Дмитрий Юрьевич
Список литературы диссертационного исследования кандидат наук Лукьянов, Дмитрий Игоревич, 2015 год
СПИСОК ЛИТЕРАТУРЫ
1. Фрай О. Детекция лжи и обмана. - СПб.: 11райм-еврознак, 2005. -320 с.
2. Экман П. Узнай лжеца по выражению лица / Пер. с англ. - СПб.: Питер, 2013.-272 с.
3. Дарвин Ч. «О выражении эмоций у человека и животных». СПб.: Питер, 2001.-384 с.
4. Schmieder F. Suport Vector Machine in Emotion Recognition Suport Vector Machine in Hmotion Recognition Author: Fabian Schmieder. Memory, 2009. 254 p.
5. Морозов В. 11. Биофизические основы вокальной речи. - M-JI.: Паука. 1977.-232 с.
6. Ильин Е. П. Эмоции и чувства. - СПб.: 11итср, 2001. - 752 с.
7. Пушикяи Э.А. Типология интонации эмоциональной речи, Киев-Одесса: Выща школа, 1986. - 160 с.
8. Психологические и психофизиологические исследования речи // Под ред. Ушаковой Т.Н. - М.: Паука, 1985. - 324 с.
9. Жинкин II. И. Речь как проводник информации. - М.: Паука, 1982. -157 с.
10. Вундт В. Основы физиологической психологии: Об элементах душевной жизни. Интенсивность ощущения. Пер. с нем. - М.: Книжный дом "ЛИБ-РОКОМ", 2010.-330 с.
11. Sherer К. Experiencing emotion. Cambridge UP, 1986. 138 p.
12. Фрай О. Ложь. Три способа выявления. Как читать мысли лжеца, как обмануть дегекюр лжи. - СПб.: I [райм-евро шак, 2006. - 284 с.
13. Изард К. Эмоции человека. - М.. 1980. - 364 с.
14. Носенко Э. Л., Ельчапипов II. Е., Крылова II. В., Петрухин Е. В. О воз-
можности оценки эмоциональной устойчивости человека но характеристикам его речи // Вопросы психологии. - 1977. - № 3. - С. 46-56.
15. Ермолаева-Томипа JI. Б., Витт II. В. Проявление эмоциональных особенностей личности в речевой деятельности // 11сихологическис исследования интеллектуальной деятельности. - М., 1979. - С. 82-87.
16. Галунов В. И., Маисров В. X. Характеристики речевого сигнала как индикатор эмоционального состояния оператора // Проблемы инженерной психологии и эргономики. Вып. Ill: Тезисы к IV Всесоюзной конференции по инженерной психологии и эргономике. - Ярославль, 1974. - С. 142-146.
17. Дорофеева О. Т. О возможных критериях распознавания эмоциональных состояний // Проблемы моделирования психической деятельности. - Новосибирск, 1968. - С. 279-280. - Вып. 2.
18. Злобип Д. Т. К классификации эмоций // Вопросы психологии. — 1991.-№4.-С. 96-99.
19. Лабунская В. А. Психологическое исследование условий, влияющих на успешность опознания эмоциональных состояний по выражению лица: Авто-реф. дис. ...канд. наук. — Л., 1976. - 16 с.
20. Лабунская В. А. Опознание эмоциональных состояний но мимике // Современные психолого-педагогические проблемы высшей школы. - Л., 1978.-Вып. 4.-С. 40-46.
21. Носенко О. JI. Изменение характеристик речи при эмоциональной напряженности // Вопросы психологии. - 1978. - № 6. - С. 76-85.
22. Тищенко JI. Г. Изучение акустических параметров речи в целях распознавания эмоционального состояния человека // Материалы III Всесоюзного симпозиума по психолингвистике. - М., 1970. - С. 86-92.
23. Scherer К. Vocal communication of emotion: A review of research paradigms, Speech communication 40 (2003), Department of psychology, University of
Gencwa, Switzerland, 2003. Pp. 227-256.
24. Выскочил II. Л. Воспринимаемое качество эмоционально окрашенных акустических событий: диссертация кандидата психологических паук: 19.00.01 / Выскочил 11. А., - М., 2011. - 182 с.
25. PaianoBa Т. Л. Эмоциональная оценка звуковых стимулов разной интенсивности//Вопросы психологии. - 1986.-№ 1. — С. 137-145.
26. Новицкая JI. П. Влияние различных музыкальных жанров па психическое состояние человека //1 Ichxojioi ический журнал. - 1984. - № 6. - С. 79-85.
27. Витт Н. В : Эмоциональная регуляция в речемыслительных процессах//Психологический журнал. - 1986.-№3.-С. 52-61.
28. Wilting Jannekc, Krahmer Lmiel, Swells Marc Real vs. acted emotional speech. Proceeding of Interspccch, Pittsburgh, Pennsylvania. 2006. Pp. 805-808.
29. Vidrascu Laurence, Devillers Laurence, Detection of real-life emotions in call centers, Intcrspeech 2005, Computer science department, Prance, 2005. Pp. 64-70.
30. Изард К. Психология эмоций. - СПб.: 11игер, 2000. - 464 с.
31. Благопадежина JI. В. Эмоции и чувспза // Психология: Учебник. - М., 1956.-364 с.
32. Анохин П. К. Эмоции // Большая медицинская энциклопедия. Т. 35. -М., 1964.-С. 339.
33. Дембовский Я. Психология живошых. - М.: Ипосфапная jmrepaiypa. 1959. 147 с.
34. Дерябин В. С. Чувства, влечения, эмоции. - Л., 1974. -224 с.
35. The Vera am Mittag German Audio-Visual Spontaneous Speech Database. URL: http://emotion-rcsearch.net/dovNnload/vam [Элекфонный ресурс]
36. Chinar Dara and Marc D Pell. The interaction of linguistic and affective
prosody in a tone language. The Journal of the Acoustical Society of America, 119(5), 2006. Pp. 303-304.
37. Шаховский В. И. Эмоциональные культурные концеты: параллели и контрасты // Языковая личность: культурные концепты. - Волтотрад: Волг. юс. пед. ун-т, 1996. С. 80-96.
38. Ермолаева М. В. Структура эмоциональных переживаний в старости // Мир психологии. - 1999. -№ 2. - С. 11-122.
39. Ильин Е. П., Пономарева М. С. Возрастно-иоловая динамика базовых эмоций // Ананьевские чгения-2001: Тезисы научно-нрактической конференции. -С116., 2001.С. 23-29.
40. Бреслав Г. М. Проблемы эмоциональной регуляции общения у дошкольников // Вопросы психологии. - 1984. - № 3. - С. 53-59.
41. Кочубей Б., Новикова Е. Эмоциональная устойчивость школьника. -М., 1988.-384 с.
42. Ланге К. Г. Аффекты. - СПб., 1890. - 127 с.
43. Блейлер Э. Аффективноеib. Внушаемость и паранойя. - Одесса, 1929. -140 с.
44. Березина Г. А. Использование цветовых и музыкальных воздействий с целью оптимизации работоспособности при выполнении монотонной деятельности // Психолот ичсскис проблемы повышения эффективности и качества труда.-М, 1977. С. 20-29.
45. Брусиловекий JI. С. Музыкотерапия // Руководство по психотерапии / Под ред. В. Е. Рожпова. - Ташкент: Медицина, 1979. С. 256-275.
46. Бодров В. A. Ilpoiпозирование эмоциональной \сюйчивос1и операторов с помощью моделей стресс-ситуации // Военно-медицинский журнал. - Л., 1973.-№ 1.-С. 47-50.
47. Дорфман Л. Я. Исследование влияния музыки на психомоторику в евя-
зи с особенностями пейродииамики: Авторсф. дис. ...канд. наук. - JI.. 1981. -15 с.
48. Дорфман J1. Я. Влияние эмоций, вызванных музыкой, на работоспособность в связи с силой нервной системы // 11сихологический журнал. -1986.5.- С. 132-136.
49. Костандов Э. А. Эффект пеопозпаваемых «эмоциональных» словесных раздражителей // Журнал высшей нервной деятельности. - 1968. - № 3. С. 18-21.
50. Носенко Э. JI. Попытка системного подхода к анализу речи в состоянии эмоционального напряжения // Психологический журнал. - 1980. - № 6. -С. 54-61.
51. Корпева Т. В. О некоторых факторах, определяющих точность аудиторской оценки эмоциональных состояний // Материалы Всесоюзного симпозиума «Речь, эмоции и личность». - JI., 1978. - С. 121-125.
52. Корпева Т. В., Бажин Ii. Ф. О роли профессионального и полового факторов в аудиторской оценке эмоционально окрашенной речи // 11роблемы космической биологии. - М., 1977. - 'Г. 34. - С. 293-299.
53. Никонов A.B. К проблеме акустической диагностики функциональных состояний человека-оператора. // Психологические и физиологические исследования речи. М.: Наука, 1985, С. 87-94.
54. Никонов A.B. К проблеме экспертной диатостики эмоционального состояния говорящего по акустическим характеристикам речевого сишала. // Возможности судебной видео фонографической экспершзы. М.: ВНИИСЭ. 1989. С. 12-26.
55. Никонов A.B. Психологические проблемы акустической диагностики функциональных состояний человека-оператора в особых условиях. //11сихоло-гические проблемы деятельности в особых условиях. М.: Паука, 1985, С. 136-153.
56. Carletta J. Assessing agreement on classification tasks: the Kappa statistic // Computational Linguistics, 1996. 2 (22). Pp. 249-254.
57. Petrushin V.A. Emotion in speech: Recognition and application to call centers, ANNIE '99, Accenture, Northbrook, 1999. Pp. 47-52.
58. Blouin C. MalTiolo V. A study on the automatic detection and characterization of emotion in voice service context, Interspecch 2005, France Telecom, R&D Division, France, 2005. Pp. 51-56.
59. Фролов M.B., Таубкип B.J1. О влиянии эмоционального состояния ликтора на некоторые параметры речевого сигнала. // Речь и эмоции. Материалы всесоюзного симпозиума. М.: АН СССР, 1975, С. 46-55.
60. Polzin Tomas s. Waibel Alex II. Detecting emotions in speech, School of computer science, Carneige Mellon University, Pittsburg, University of Karlsruhe, Germany, 1998. Pp. 74-78.
61. Lee C.M. Narayanan S. Pieraccini R. Recognition of negative emotions from the speech signal, Dept. of electrical engineering and IMSC, University of southern California, Los Angeles, Speechworks international, New York, USA, 2001. Pp. 38-43.
62. Vidrascu Laurence, Devillers Laurence, Real-life emotions detection with lexical and paralinguistic cues on human-human call center dialogs, Interspecch 2006, Computer science department, France, 2006. Pp. 58-61.
63. Laukka Petri, Vocal expression of emotion, discrete-emotions and dimensional accounts, Department of psychology, Uppsala University, 2004. Pp. 28-35.
64. Liscombe Jackson, Venditti Jennifer, Ilirschberg Julia, Classifying subject ratings of emotional speech using acoustic features, Eurospeech 2003- Geneva, Department of computer science, Columbia University, New York, 2003. Pp. 37-41.
65. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов/ Т.К. Винцюк. - М.: Радио и свя зь, 1987. - 233 с.
66. Михайлов В.Г. Измерение параметров речи/ В.Г. Михайлов, JI.B. Зла-тоустова. - М.: Радио и связь, 1987. - 168 с.
67. Рабипер J1.P. Цифровая обработка речевых сигналов / JI.Р. Рабипер, Р.В. Шафер. - М.: Радио и связь, 1981.-495 с.
68. Флапаган Дж. Анализ, синтез и восприятие речи / Дж. Фланаган. - М.: Связь, 1968.-456 с.
69. Фант Г. Акустическая теория речеобразовапия / Г. Фант. - М.: Наука, 1964.-284 с.
70. Калиннев К).К. Разборчивость речи в цифровых вокодерах/ IO.К. Ка-линцев. -М.: Радио и связь, 1991. -220 с.
71. Фролов М.В. Контроль функционального состояния человека-оператора/ М.В.Фролов. - М.: 11аука, 1985. -200 с.
72. Маркел Дж.Д. Линейное предсказание речи / Дж.Д. Маркел, А.Х. Грей. - М.: Связь, 1980. - 308 с.
73. Аграновский А.В., Ледпов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. М.: Радио и связь, 2004. - 164 с.
74. Xu Jian-Wu. A pitch detector based on a generalized correlation function/ Jian-Wu Xu, Jose C. Principe // IEEE Trans. Audio, Speech, and Lang. Process. 2008. Vol. 16, No.28. Pp. 1420-1432.
75. Martin F. A fundamental frequency estimator by crosscorrelation of adjacent spectra // Proceedings of the Speech Prosody. 2008. Pp. 147-150.
76. Архинов И.О. Оценка точности выделения основного тона методом GS/ И.О. Архипов, В.Б. Гитлин // XI сессия Российского акустического общества «Современные речевые технологии»: сб. тр. М., 1999. С. 38-42.
77. Huici M.L.Il.D. Combined algorithm for pitch detection of speech signals/ M.E.H.D. Huici, J.V.L. Ginori // Electronics Letters. 5th -1995. Vol.3 1. № 1.
78. Рабинер Л. Теория и применение цифровой обработки сигналов/ Л. Ра-
бинер, Б. Голд. - М.: Мир, 1978. - 848 с.
79. Resch В. Intimation of the instantaneous piteh of speeeh/ В. Resch, M. Nilsson, A. Ekman, W. Kleijn // IEEE Trans. Audio, Speech, and Lang. Process. 2007. Vol. 15. No. 3. Pp. 813-822.
80. Способ выделения основного гона. llai. 2174714 Российская Федерация / Архипов И.О., Веркиепко 10.В., Гиглип В.Б., Казаков B.C. Заявитель и патентообладатель 11аучпо-1ехнический центр "Вычислительная техника". - № 98108956/09; заявл. 12.05.98; опубл. 10.10.02.
81. System and method lor multi-channel pitch detection. Patent No.: 20090222260 US IPCS: AG10L1104PI / David W. Petr Agents: SUITER SWANEZ PC LEO.- date of Patent: Sep. 3, 2009.
82. Milner Ben Prediction of fundamental frequency and voicing from mel-frequency cepstral confficients for unconstrained speech reconstruction/ Ben Milner, Xu. Shao // IE Eli Trans. Audio, Speech, and Lang. Process. 2007. Vol.15, No.l. Pp. 24-33.
83. Способ выделения основною тона из речевого сигнала. Ilaiein 2184399 Российская Федерация: G101Л 5/00, G10L101/02/ Атраттовский А.В., Ледпов Д.А., Потапенко A.M., Репалов С.А., Сулима I I.M. Заявитель и патентообладатель Государственное предприятие Конструкторское бюро "Спецву зав-тома гика". - № 2000124181/09; заявл. 22.09.00; опубл. 27.06.02.
84. Refinement of pitch detection. Patent No.: 6885986 US: C1.7. G10L 11/04 /Ercan F. Gigi; Assignee: Koninklijke Philips Electronics N.V., Eindho\en (NL).-filed: May 7. 1999; date of Patent: Apr. 26, 2005.
85. Кириллов СЛ. Лукьянов Д.И. Исследование влияния эмоциональною состояния человека па параметры речевою сигнала // Вестник РГРТУ. - Рязань. 2014. - № 48. - С. 45-51.
86. Лукьянов Д.И. Определение значимых параметров речевою сообщения для выявления психоэмоциональною состояния человека по шкале у довод ь-
ствие-неудовольсгвие // Восемнадцати всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях»: Тез. докладов. - Рязань: РГРТУ, 2013.-С. 103-104.
87. Лукьянов Д.И. Распознавание психоэмоционального состояния человека на основе параметров речи. // Двадцап, нягая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы»: Тез. докладов. - Рязань: РГРТУ, 2012. - С. 192-193.
88. Чесебиев И. А. Компьютерное распознавание и порождение речи / И. А. Чесебиев. — М.: Спорт и кулыура, 2008. - 128 с.
89. Roy С. Snell, Formant Location From LPC Analysis Data // 1ННГ transactions on speech and audio processing. Vol. 1, № 2, 1993. Pp. 129-134.
90. Носенко Э. JI. Особенности речи в состоянии эмоциональной напряженности. -Днепропетровск, 1975. - 132 с.
91. Forsell М. Acoustic Correlates of Perceived Emotions in Speech. Master of Science Thesis, 2007. 94 p.
92. Скорость, темп речи. |Электронный ресурс|: http://www.constudio.ru/2008/11 /skorost-tcmp-rechi.html (дата обращения: 05.11.2014)
93. X.L. Liu, Y. Liang, Y.H. Lou, II. Li, B.S. Shan, Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models // International Conference on Pattern Recognition, 2010. Pp. 81-84.
94. M.Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "Robust Voice Activity Detection and Noise Reduction Mechanism" // Institute of Electronics Systems, 2005. P. 69.
95. DMA minimum performance standards for discontinuous transmission op-
eration of mobile stations Т1Л doc. and database IS-727, 1998.
96. Гольдипсйн B.C., Пиичук Д.В., Суховицкий ДЛ. «IP-'Гелефония». 2001.С. 75-76
97. Морозов В.11. 11сихоаку стические аспекты восприятия речи. // Механизмы деятельности мозга человека / Под ред. Бехтеревой П.П., М.: Паука, 1988, С. 578-601.
98. Басов О.О., Носов М.В., Шалагинов В.Д. Исследование характеристик джиггера периода основного топа речевого сигнала // SPIIRAS Proceedings. 2014. Issue 1(32). С. 27-44.
99. Mircia Farms, Javier 1 lernando, Pascual Hjarque Jitter and Shimmer Measurements for Speaker Recognition // lnterspeech. ISCA, 2007. Pp. 778-781.
100. Xuedong Huang, Spoken language processing: a guide to theory, algorithm, and system development / Xuedong Huang, Alex Лссго, Hsiao-Wuen lion, 2001, Prentice Hall PTR. 980 p.
101. Дмитриев B.T., Ссмии Д.С., Випотрадова M.H., Лукьянов Д.И., Кар-тавеико Я.О. Определение информативных параметров речи для выявления эмоционального состояния диктора и качества речи при влиянии различных акустических помех //Десятая международная научная конференция «Перспективные технологии в средствах передачи информации»: Гез. докладов. - Владимир: ГГГС11И,2013.-С. 151-152.
102. Mandar Gilke , Pramod Kachare , Rohit Kothalikar , Varun Pius Rodrigues, Madhavi Pednekar, MI;CC-based Vocal Emotion Recognition Using ANN. IPCSIT vol. 49 (2012). Pp. 150-154.
103. Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976.-756 с.
104. Маркел Дж. Д., Грэй А.Х. Линейное предсказание речи: Пер. с англ. / Под ред. 10.II. Прохорова и B.C. Звездина. - М.: Связь, 1980. - 308 с.
105. Deller, John R., John C). Proakis, and John II. L. Hansen. Discrete-Time Processing of Speech Signals. New York: Macmillan, 1993. P. 936.
106. Papamiehalis, Panos L. Practical Approaches to Speech Coding. Lng-lewood Cliffs, NJ: Prentice I Iall, 1987. P. 399.
107. Makhoul, J Linear Prediction: A tutorial review. Proc. ILLL. 63, 63, 56 (1975).
108. Markel J.D., Gray A.LI. Linear Prediction of Speech. New York, Springer-'Verlag, 1976.
109. Лукьянов Д.И. Оценка коэффициентов линейного предсказания речевого сигнала в зависимости от психоэмоционального состояния человека // Девятнадцатая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях»: Тез. докладов. - Рязань: РГРТУ, 2014. - С. 115-116.
110. Магнус К. Колебания: Введение в исследование колеба1ельных систем. Пер. с нем. - М.: Мир, 1982. - 304 с.
111. XypiHH Я..И., Яковлев В.11. Met оды 1еории целых функций в радиофизике, теории связи и ошике. - М.: Государственное издательство физико-математической ли i ера туры, 1962. - 220 с.
112. Лукьянов Д.И. Оценка возможности использования фазовых портретов для определения психоэмоционально]о состояния дикюра // Восемнадцатая международная телекоммуникационная конференция молодых ученых и студентов «Молодежь и паука». Тезисы докладов. - Москва, 2015. - С. 22-23.
113. Нушикян Э. А. Типология интонации эмоциональной речи. - Киев: Одесса, 1986.- 160 с.
114. Колымба И. Г. Экспериментальные методы исследования ипюпа-ции эмоциональной речи // Новые исследования в психологии. - 1974. - № 3. -С. 15-16.
115. Витт II. В. Информация об эмоциональных состояниях в речевой интонации // Вопросы психологии. - 1965. - № 3. С. 89-102.
116. Каминский Е. И. Психологические особенности интонационной выразительности речи, ее восприятия и воздействия: Авюреф. дис. ...канд. наук. -Л., 1990.- 15 с.
117. Борисова Л. Л. Восприятие эмоционального состояния человека но интонационному рисунку речи // Вопросы психологии. - 1989. - № 1. - С. 49-60.
118. Пирогов A.A. Основы фонетической теории речи. Фонетическая функция как универсальный природный инструмент кодирования (декодирования) речевой информации любого происхождения. ЖРФМ. 2001. № 1-12. - С. 15-28.
119. Кириллов С.П., Шустиков O.Ii., Мамушев Д.Ю. Идентификационная значимость статических и динамических признаков речевого сигнала в системах распознавания дикторов // Весшик Рязанской юсударспзеппой радиотехнической академии. 2000. № 7. - С. 92-96.
120. Шустиков O.E. Функция распределения оценки обобщенного спектра мощности случайного процесса. // Рязань: Вестник Рязанской государственной радиотехнической академии. 2001. № 8. - С. 14-18.
121. Ивахнепко Л. Г. Долгосрочное прогнозирование и управление сложными системами. - К.: Тсхшка, 1975. - 312 с.
122. Колмогоров А. II. Интерполирование и жсфаполировапие стационарных случайных последовательноеIей // Изв. АН СССР. Сер. матем., т. 5:1. 1941.-С. 3-14.
123. Кириллов С.П., Лукьянов Д.И. Исследование возможности оценки психоэмоционального состояния человека посредством анализа речевого сит-нала при действии акустических помех сигнала // Вестник РЕРТУ. - Рязань. 2015.-№51.-С. 19-23.
124. Хитров М.В., Давыдов Л.Г., Киселёв В.В., Ромашкин К).П., Ткачеия A.B. Автоматическое распознавание эмоций по речи с использованием метода опорных векторов и критерия джипа // Речевые технологии, 2012. С. 34-43.
125. Суворов Г.А., Лихпипкий A.M. Импульсный шум и его влияние па организм человека. Издательство "Медицина", г. Ленинград, 1975. -208 с.
126. Основы передачи дискретных сообщений: Учебное пособие для студентов очной и заочной форм обучения / II.В. Будылдипа. - Екатеринбург: УрТИСИ ГОУ ВПО «СибГУТИ», 2009. - 142 с.
127. Красилышков В.А. Звуковые и ультразвуковые волны. Издание 3. — М.: Еосударствеппое издательство физико-математической литературы, 1960. -560 с.
128. Баранов В.М. Акустическая диагностика и контроль па предприятиях ТЖ. - М.: 11аука, 1998. - 304 с.
129. Худов В.II. Избирательная телефонная связь па железнодорожном транспорте. - М.: Транспорт, 1981. - 238 с.
130. Петраков A.B. Защита и охрана личности, собо венное i и, информации: Снрав. Пособие. — М: Радио и связь, 1997. - 320 с.
131. Алдошииа И.А. Основы психоакустики. Оборопгиз, Москва, 2000. -154 с.
132. Leon W, Couch II, Digital and Analog Communications Systems. - 6 ed. - Prentice Hall, New Jersey, 2001. P. 406-409.
133. Дмифиев B.T., Лукьянов Д.И. Алгоритм маскирования на основе представления Хургипа-Яковлева с использованием производных второго и третьего порядков // Вестник РГРТУ. - 2012. - №42. - С. 13-17.
134. Дмитриев В.Т., Лукьянов Д.И. Применение представления Хургина-Яковлева в пеинвазивной диагностике голосового тракта. // Двадцать четвертая всероссийская научно-техническая конференция студентов, молодых ученых и
специалистов «Биотехнические, медицинские и экологические системы и комплексы»: Тез. докладов. — Рязань: РГРТУ, 2012. - С. 86-87.
135. Дмитриев В.Т., Лукьянов Д.И. Использование представления Хур-гина-Яковлева в системах обработки речевых сигналов при использовании отсчетов сигнала и первых трех производных. // Семнадцатая международная научно-техническая конференция «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций»: Тез, докладов. - Рязань: РГРТУ, 2012.-С. 67-68.
136. Кириллов С.П., Дмитриев В.Т. Реализационные возможности и помехоустойчивость процедуры восстановления сигналов па основе алгоритма Хургина-Яковлева // Радиотехника, 2003. №1. С. 73-75.
137. Морслос-Сарагоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение. - М.: Техносфера, 2006. - 320 с.
138. Кириллов С.П., Дмифиев В.Т. Асинхронное маскирование речи на основе алгоритма Хургина-Яковлева // Новые информационные технологии, 2004. №1. - С. 46-48.
139. Кириллов С.П., Дмитриев В.Т. Асинхронное маскирование, обнаружение фальсификаций и реставрация фонограмм речевых сигналов на основе алгоритма Хургина-Яковлева. // Безопасность информационных технологий. 2003. №2. - С. 26-30.
140. Кириллов С.П., Покровский П.С., Семин Д.С., Лукьянов Д.И., Яшин А.10., Лисиичук А.А. Адаптивная к мешающим факторам, номехозащищенная радиолиния передачи информации // Шсетнадцактя международная конференция «Цифровая обработка сигналов и се применение - П8РА-2014»: Тез. докладов. -Москва, 2014. - С. 80-84.
141. Акопов Э.В., Лисиичук А.А., Лукьянов Д.И., Яшин АЛО. Адашив-ные системы передачи информационных сообщений, устойчивая к воздействию мешающих факторов // Международная конференция «Радиоэлектронные
устройства и сисмсмы для иифокоммупикациоппых технологий - РЭУС-2014». Тезисы докладов. - Москва, 2014. - С. 186-190.
142. Лукьянов Д.И. Оценка влияния харакк'риешк систем передачи информации на речевой сигнал, имеющий эмоциональный окрас // Межву зовский сборник научных трудов «Методы и средства обработки и хранения информации». - Рязань, 2014. - С. 94-98.
143. Лукьянов Д.И., Лисничук A.A. Анализ влияния структуры систем передачи речевой информации на качество оценки психоэмоционального состояния человека// Четвертая всероссийская научно-техническая конференция «Информационно-измерительные и управляющие системы военной техники». Тезисы докладов. - Владимир, 2014. - С. 100-102.
144. Лагутин B.C., Петраков A.B. Утечка и защита информации в телефонных каналах. - М: Энергоатомиздаг, 1996. - 304 с.
145. Петраков A.B., Лагутин B.C. Защита абонентскою i еле трафика. — М.: Радио и связь, 2002. - 504 с.
146. Пат. № 2-45857, Япония, МКИ5 II 04 К 1/04. Уаройство для секретных переговоров /1 Innnoii муеэп К.К. (Яп.)
147. Пат. № 1-47062, Япония, МКИ5 И 04 К 1/04, II 04 В 1/ 62. Система скрытой связи с инвертированием/ Пиппон дэпсип дэнва К.К. (Ян.)
148. Пат. № 1-47061, Япония, МКИ5 II 04 К 1/04. Система секретной связи / Нинпоп дэпсип дэнва К.К. (Яп.)
149. Пат. № 3-49221, Япония, МКИ5 II 04 К 1/04, 1/06. Устройство для секретных переговоров / Пиппон муон К.К. (Яп.)
150. Малипин Ю.И., Холопов С.И. Охо-маскираюр для радио- и телефонных каналов связи // Алгоритмическое и аппаратное обеспечение систем автоматизации научных исследований: Сборник научных трудов. Рязань, 1996.-С. 92-96.
151. Комплекс электронных средств защиты обьектов и информации: Гос.рег. №01970012079. Отчет по ПИР 2-97Г / РГРГЛ; Руковод. Малинин Ю.И.; Соисполнитель: Малинин Д.Ю. Раздел "Информационные технологии, электроника и связь". Рязань, 1997. - С. 29-36.
152. Дмитриев A.C., Папас Д.И., Старков С.О. Динамический хаос как парадигма современных систем связи // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники. 1997, №10. - С. 4-27.
153. Кириллов С.П., Малинин Д.Ю. Оптимальные системы маскирования речи в каналах связи с ограничением по скорости передачи информации // Сборник научных трудов "Автоматизация испытаний и измерений". РГРТА, Рязань,2000. - С. 55-58.
154. Малинин Д.Ю. Исследование и разработка методов повышения эффективности асинхронного маскирования речевых сигналов: Авторсф. дис. ...канд. наук. - Рязань, 2001. - 15 с.
155. Кириллов С.П., Малинин Д.Ю. Miioi окршериальпый анализ алгоритмов асинхронного маскирования речевых сш налов// Весшик РГРТА, 1998, № 5.-С. 9-14.
156. Лукьянов Д.И. Алгоритм маскирования, выявления фальсификаций и восстановления фонограмм на основе представления Xypi ина-Яковлева. // Пятьдесят девятая студенческая научно-техническая конференция: Тез. докладов. - Рязань: РГРТУ, 2012. - С. 7-8.
157. Дмитриев В.Т., Лукьянов Д.И. Исследование алюритма обработки речевых сигналов па основе представления Хургина-Яковлева для защиты фонограмм от фальсификаций. // Семнадцатая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов: Тез. докладов. - Рязань: РГРТУ, 2012. - С. 65-67.
158. Лукьянов Д.И. Реализация алгоритма защиты, выявления фальсификаций и восстановления фопотрамм на основе представления Хургина-
Яковлева. //Вторая итоговая конференция молодых инноваторов по программе «Умник» в Рязанской обласш: Тез. докладов. - Рязань: РГРТУ, 2012. - С. 21-23.
159. Дмшриев В. Г., Лукьянов Д.И. Использование представления Хур-гина-Яковлева для создания закрытого формата записи и хранения речевых сообщений // Семнадцатая международная телекоммуникационная конференция молодых ученых и студентов «Молодежь и паука». Тезисы докладов. - Москва, 2014.-С. 33.
160. Лукьянов Д.И. Оценка интенсивное!и эмоционального состояния космонавтов посредством речевого сообщения. // Шестая международная научно-техническая конференция «Космонавтика. Радиоэлектроника. Геоинформатика»: Тез. докладов. - Рязань: РГРТУ, 2013. - С. 168-169.
161. Лукьянов Д.И. Система оценки психоэмоционального состояния пациента при удаленном общении. // Двадцать седьмая всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы»: Тез. докладов.-Рязань: РГРТУ, 2014. - С. 115-116.
162. Солонина Д. И. Алгоритмы и процессоры цифровой обработки сит-налов/ Д.И. Солонина, Д.А.Улахович, Л.А. Яковлев - СПб.: БХВ-1 кмерб)рг, 2002. -464 с.
163. Рабинер Л., Голд Б. Теория и применение цифровой обработки сит-налов. -М.: Мир, 1978.-848 с.
164. Петров Е.П., Частиков А.Б. Диализ возможностей программной реализации цифровых фильтров с помощью цифровых процессоров сигна-лов//Изв. вузов Радиоэлектроника. 1999, № 4. С. 63-68.
165. Колмоторов А.II. Представление непрерывных функций многих переменных суперпозицией функций одной переменной и сложением // ДАП. 1958. №5.-С. 953-956.
166. Проблемы построения и обучения нейронных сетей / под ред. А.И.
Галушкина и В.А. Шахнова. — М.: Машиностроение. Библиотечка журнала «Информационные т ехнологии», 1999. - 216 с.
167. Strachey С. «А General Purpose Macrogenerator». Computer Journal 8 (3): Pp. 225-241.
168. Шахнов В.А., Власов А.И., Кузнецов A.C. Элементная база параллельных вычислений// Открытые системы. 2001. № 5-6. - С. 15-19.
169. Червяков Н.И., Сахшок H.A., Шапошников A.B. Пути эффективного использования иерархических структур сегментов нейронных се гей на ПЛИС Xilinx при аппаратной реализации цифровых филыров с параллельной обработкой данных //Нейрокомпьютеры: разработка и применение. № 10. 2001. - С.45-50.
170. Антонов А.П. Язык описания цифровых устройств AlterallDL. Практический курс. М.: Издательское предприятие РадиоСофт, 2002. - 224 с.
171. Галушкин А.И. Некоторые исторические аспекты развития элементной базы вычислительных сис1ем с массовым параллелизмом (80-е и 90-е годы) // Нейрокомпьютер, 2000. № 1. -С.3-15.
172. Шлесв С.Г. Элементная база и архитектура цифровых радиоприемных устройств //1 Цифровая обрабоиса сигналов. 1999. № 1. -С.36 47.
173. Папгелейчук А. Основы выбора цифровых сигнальных процессоров// Электронные компоненты. 2006. № 6. -С.3-15.
174. Методы выбора МП для использования в Ml 1С/ Аксенов А.И., 11ур-гов С.Т., Терсхип В.И. и др.// Обзоры по электронной технике. - М.: Издательство ЦНИИ "Электроника", 1985. Серия З.Микроэлскфоиика. Вып.2(1102). 30 с.
175. TI's catalog of digital signal processors Texas Instruments. [Электронный ресурс]. -Режим доступа: http://www.ti.com/lsds/li/dsp/products.page (дата обращения: 22.02.15).
176. Analog Devices Processors and DSP [Электронный ресурс]. -Режим доступа: http://www.analog.com/en/processors-dsp/products/index.hlml (дата обращения: 22.02.15).
177. Freescale Digital Signal Controllers |Электронный ресурс]. -Режим доступа:
http://www.freescale.com/webapp/sps/site/homepage.jsp?code=DSC_I IOMF&tid=F SH (дата обращения: 22.02.15).
178. ОАО «ПИИЭТ» [Электронный ресурс]. -Режим доступа: http://www.niiet.ru/chips/processors (дата обращения: 22.02.15).
179. Отчет по ОКР «Модернизация программна о кодека АДИКМ речевого сигнала». Шифр: «Язык ПО». 2013. 76 с.
t ц
Ч
I
: 178
i
? ПРИЛОЖЕНИЕ А. КОПИИ АКТОВ О ВНЕДРЕНИИ
РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ
V „р I, ••¡«о 11|чч1.'1ч «up i'U •, чсоно,: pauoie
FiMH'.'KOi 0 i Oi \ .!Л!Ч ' iiCHHUI о
рСгькпе\нн1>есч'Ч <» \ пнверсикчл
Ml] Дчбков J' . ______-p _ 2015i.
\ i V I
о wiej рении j>l .ы.¡it (, uici.up! uiiiutfмои n, ,"oi 1,1 av i sip in ia
I'm LUKboi о ! oo .apt. i i.ehHoi о p.t woi evimi,vv> oi <> \ iumqxine! л
Ь м.ичоьл, l' и ip.w 1 !i nj4 илч .
. 1 1С >•! a!' IS <)[,. t P UK ! oi i> и > ■ 1 n> w 4 • . j< >(e» 1 [, . '1 all a
"hi M HI H ) ¡'1 P ! X
I I.К Г/ШИШ .IK I .."С I 'II Mi 1 П" ПО Ч |\ KhllllC ,Ч'П.;Ь!Л1Ы uietepi i донной p но, i, .hi., ШИ ...li!
1 \ ) opn i \i сир,- ч ¡С",1 м i4 ■ i in f.5 ¡миногу i mi и пи 'и)' , '>e "I'l^ei a no чарлиерие! икам речевой» сипи i t на вьк>> >• • ,n i -м < >мрл'~ч>11 и а пере ими ШЮорм 1 .'!!'.
2 ^ hiipttiM Matм'роьашп' p> чеин иноор".чии>i! ¡и (чноьо upe ic f лвлени* \) pi ili|,. /1 a)ti iei'.a
r . ■ i "ч1' < . > .« v. . Ф1 Ы >\ i'.1 < i PI P 1 V ............ '
Мрч.И I'llllim'.l II 4VI.I. . -1..V,' I.*!. 'I,1 ."'формации » if <\!hoii>> i-ni ibtii.K • i)i >p >! i.'e ч.чк".1'" ep. i'ij< а .рле а и\ (ai'»nbi> no eiie..i'. i i »v. . и 1 ' ir и P > ; oiuiiii. a . мы a komi, leKw ы<> ,i
a Ml pa i >il i О 1 i О i I 0 -1 1 I '1 i г '* > % '«Ни И a i t| 1 |,ч ч. > и i ll, il !СМЫ 1.ВЯШ ■
Деьаь ФР1
iiu i jib po;i |'\(
г f
Ь 11 «Ра ,i1 монон
«УПМ'РЖДЛЮ»
1 lepnuii шмееп-пе ib i ецералын)! о koiicipv клора ()Л(! «Российские кос vi и чес к ис СИС11'МЬ0> /
Г.1 t'iviidK
20! 5r
AKT
о внедрении результатов диссертационной работы аспирант Рязанскою юсударственного радиотехнического университета Лукьянова Дмитрия Июревича в ОАО «Российские космические системы» Комиссия в составе:
председателя:
заместителя начальника отделения ОАО «Российские космические системы». доктора 1ечнически\ на_\к, профессора Напшпа Втатнмира Михайловича; членов комиссии:
заместителя начальника отлета ОАО «Российские космические системы», кандидататехническик на\к Полтавца Юрия Ивановичи:
эксперта оыеления ОАО «Российские космические системы», кандидата технических наук Гвсшякова Юрия Ллекчанлровича составила акт о том, что в 2012-2013 г. следующие резутьташ диссертационной рабош Лукьянова Д.И. бы ш внедрены в рачках ПИР «1 елеприбор-РГРТУ» в ОАО «Российские космические системы»
1. Алторитм определения нсихопюционадыин о состояния человека но характеристикам речевою сипи и на вычо те систем обработки и передачи итерированных. цифровых информационно-) правтяюшич потоков
dej/
2. Алгоритм маскирования речевой информации на ошове претеIявления Хурт ина-Яков ¡ева
Результаты диссертационной работы Лукьянова Д.И позволили повысить качество передаваемого речевою chj нала в среднем на ().>-! балл, распараллелить операции при более простои реа нплпии синтезирующих фильтров и уветичить котичество комбинации адтритма маскирования в К)1'' pas Кроме юю, подученные результаты по то шли осуществить оценку пеихопюционд тыино соетояттття на выходе речевых катта юв связи с вероятностью до восьмидесяти пяти процентов
Председатель комиссии
H VI Ватутин
Члены комиссии
J^j К) И. Полтавец ' Ю A I воияков
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.