Методы шумопонижения речевых сигналов с использованием гребенчатых фильтров в цифровых слуховых аппаратах тема диссертации и автореферата по ВАК РФ 05.11.18, кандидат наук Чесноков, Михаил Александрович
- Специальность ВАК РФ05.11.18
- Количество страниц 160
Оглавление диссертации кандидат наук Чесноков, Михаил Александрович
Содержание
ВВЕДЕНИЕ
1. Обзор методов шумоподавления в устройствах индивидуальной слухокоррекции
1.1 Общие положения
1.2 Устройства индивидуальной слухокоррекции. Этапы и назначение
1.3 Методы шумоподавления используемые в слуховых аппаратах
1.3.1 Метод фиксированных фильтров для стационарных шумов
1.3.2 Многополосная фильтрация
1.3.3 Перцепционное шумоподавление
1.4 Выводы
2. Динамическая интерполяционная подстройка гребенчатого фильтра
2.1 Система фильтрации речевого сигнала на основе определителя частоты основного тона и гребенчатого фильтра
2.2 Оценка эффективности гребенчатого фильтра в задачах фильтрации речевого сигнала
2.2.1 Анализ передаточной функции гребенчатого фильтра с положительной обратной связью
2.2.2 Анализ передаточной функции гребенчатого фильтра с отрицательной обратной связью
2.2.3 Анализ импульсной характеристики гребенчатого фильтра с положительной обратной связью
2.2.4. Анализ импульсной характеристики гребенчатого фильтра с отрицательной обратной связью
2.2.5 Сравнительный анализ реализаций гребенчатого фильтра с положительной и отрицательной обратными связями
2.2.6 Оценка коэффициента подавления шумов гребенчатым фильтром32
2.2.7 Полоса пропускания гребенчатого фильтра
2.2.8 Оценка практической эффективности дискретного гребенчатого фильтра
2.3 Интерполяционный алгоритм
2.4 Влияние точности подстройки
2.5 Выводы
3 Помехоустойчивая система определения периода основного тона речевого сигнала
3.1 Алгоритм поиска периода основного тона
3.2 Оценка работы системы определения периода основного тона для гласных звуков: «А», «О», «У», «И», «Ы», «Э»
3.3 Выводы
4 Комплексная экспериментальная оценка эффективности системы шумоподавления
4.1 Методика испытаний системы шумоподавления для измерения увеличения отношения сигнал-шум
4.2 Результаты испытаний компьютерной модели системы шумоподавления
4.2.1 Результаты испытаний при синтетическом речеподобном входном сигнале
4.2.2 Результаты испытаний для вокализированных участков речи
4.3 Реализации алгоритма шумопонижения на отладочном комплекте Shark ADSP 21369
4.4 Выводы
Заключение
Список литературы
Приложение
Рекомендованный список диссертаций по специальности «Приборы и методы преобразования изображений и звука», 05.11.18 шифр ВАК
Элементы и устройства повышения устойчивости электроакустических систем: развитие теории, исследования и разработка2011 год, кандидат технических наук Шишкина, Анна Федоровна
Модели и методы обработки аудиосигналов телекоммуникационных систем в сложной помеховой обстановке0 год, доктор технических наук Кропотов, Юрий Анатольевич
Методы и средства адаптивной компенсации акустической обратной связи при передаче речевой информации2016 год, кандидат наук Кондратьев, Кирилл Валерьевич
Пространственная обработка речевых сигналов на фоне интенсивных распределенных помех2020 год, кандидат наук Миронов Никита Андреевич
Методы и алгоритмы узкополосной адаптивной фильтрации в радиотехнических системах2013 год, кандидат наук Витязев, Сергей Владимирович
Введение диссертации (часть автореферата) на тему «Методы шумопонижения речевых сигналов с использованием гребенчатых фильтров в цифровых слуховых аппаратах»
ВВЕДЕНИЕ
Актуальность
Устройства шумоподавления речевых сигналов предназначены для повышения разборчивости речи в системах распознавания речи и в устройствах индивидуальной слухокоррекции - слуховых аппаратах. В этих системах широкое распространение получила технология, которая основана на выделении в энергетическом спектре речевого сигнала частотных полос, энергия которых выше заданного порогового уровня и подавлении шума в остальных частотных полосах. При установлении величины порогового уровня используются неоднозначные субъективные критерии. Данная технология, являясь инвариантной к виду спектра входного сигнала, не учитывает особенностей речевого сигнала, что ограничивает возможности ее применения. Эта особенность состоит в том, что в спектре речевого сигнала присутствует основной тон и его гармоники для вокализированных участков речи. Между тем в ряде технических приложений используется периодичность сигнала для выделения информации о свойствах источника [1], о его местоположении [2,3]. Периодичность речевого сигнала позволяет применить согласованный гребенчатый фильтр для выделения сигнала из смеси с шумами. Решение этой задачи применительно к речевому сигналу слабо отражено в литературе.
Повсеместное внедрение цифровых методов позволило реализовать методы и программные принципы построения устройств цифровой обработки речевых сигналов, но выдвинуло ряд проблем, связанных с дискретным способом описания речевых сигналов. К ним относится проблемы выбора шага дискретизации и объема выборки речевого сигнала, исключающие потерю существенно важных составляющих спектра.
Тривиальное решение, связанное с выбором очень малого шага дискретизации и большого объёма выборки, приводит к требованию иметь в вычислительных средствах значительный объём памяти и высокую скорость обработки. Это вступает в противоречие с необходимостью обеспечить малые габариты и малую потребляемую мощность цифрового слухового аппарата. Адаптация методов построения гребенчатых фильтров применительно к задаче шумопонижения речевого сигнала в цифровых слуховых аппаратах и решение проблемы выбора шага дискретизации составляет содержание данной диссертации.
Таким образом, тенденции в разработке цифровых слуховых аппаратов и существующее состояние вопроса минимизации габаритов и потребляемой мощности цифровых слуховых аппаратов и их массовое применение обусловили необходимость и актуальность решения задач, рассматриваемых в диссертации.
Цель диссертационной работы состоит в разработке методов понижения шума в речевых сигналах применительно к мало исследованным в литературе принципам построения гребенчатых фильтров с учётом особенностей обработки речевого сигнала в цифровых слуховых аппаратах.
Для достижения указанной цели в диссертационной работе необходимо было решить следующие задачи:
1. Исследовать зависимость величины шумопонижения от длительности импульсной характеристики гребенчатого фильтра с целью определения предельной величины шумопонижения.
2. Разработать интерполяционный метод настройки гребенчатого фильтра, обеспечивающий совпадение частот максимумов АЧХ гребенчатого фильтра с частотами основного тона и его гармоник.
3. Модифицировать метод определения периода основного тона по автокорреляционной функции, позволяющий учесть её дискретный характер.
4. Провести математическое моделирование цифрового слухового аппарата в среде MATLAB и натурное моделирование этого аппарата на основе отладочной платы микропроцессора Shark.
Методы исследования. Теоретические и экспериментальные исследования базируются на использовании аппарата математического анализа, теории и методов вычислительной математики, теории цепей и сигналов, методов математического моделирования.
Научная новизна диссертационной работы состоит в следующем:
1. Полученная в замкнутой аналитической форме зависимость величины шумопонижения от длительности импульсной характеристики позволила при анализе параметров гребенчатого фильтра учесть психофизические особенности восприятия человеком речевого сигнала.
2. Сформулирован общий принцип решения проблемы выбора шага дискретизации, основанный на выделении подмножества отсчётов и решении на этом подмножестве задачи интерполяции при настройке гребенчатого фильтра и задачи аппроксимации при определении периода основного тона.
3. Предложена новая структура гребенчатого фильтра, использующая несколько отводов от линии задержки для реализации линейки полосовых фильтров, выделяющих сигнал основного тона из смеси с шумами.
4. Разработан алгоритм обработки сигнала настраиваемым гребенчатым фильтром в реальном масштабе времени.
Практическая значимость
1. Достигнуто увеличение отношения сигнал-шум на 6дБ и более, при длительности переходного процесса 20мс и частоте дискретизации 8кГц.
2. Полученные в диссертации графики и таблицы применимы в качестве справочного материала при конструировании цифровых слуховых аппаратов.
3. Учет дискретности линии задержки гребенчатого фильтра обеспечивает дополнительный выигрыш в степени шумопонижения на 1дБ, при частоте дискретизации 8кГц.
4. Применение гребенчатой фильтрации в слуховом аппарате привело к увеличению разборчивости для людей с нарушениями слуха, в особенности больных с сенсоневральной тугоухостью.
Положения, выносимые на защиту:
1. Принцип определения периода основного тона состоящий в аппроксимации интервалов дискретной автокорреляционной функции, с помощью гладкой функции, увеличивает точность определения значения периода основного тона речевого сигнала.
2. Метод шумоподавления на основе гребенчатой фильтрации, учитывающий рассогласование положения пиков частотной характеристики фильтра и частот спектральных составляющих речевого сигнала, по причине дискретной структуры линии задержки фильтра.
3. Результаты сравнительного анализа систем шумопонижения на основе гребенчатой фильтрации с учетом и без учета дискретного характера линии задержки гребенчатого фильтра, выявившие особенности цифровой реализации устройств шумопонижения.
4. Алгоритм обработки сигнала настраиваемым гребенчатым фильтром в реальном масштабе времени, обеспечивающий увеличение отношения сигнал-шум для вокализованных участков речи.
Реализация и внедрение результатов исследования
Результаты исследования были использованы при проведении в СПбГУКиТ НИР «Разработка алгоритма и микропроцессорная реализация устройств выделения частоты основного тона», номер 01201254373, шифр: 736-ФР, а также внедрены в учебный процесс по кафедре электротехники и технической электроники СПбГУКиТ при изучении магистрантами дисциплины «Устройства приёма и обработки сигналов» и дисциплины «Математическое моделирование радиотехнических устройств».
Апробация работы. По материалам данной работы были сделаны доклады на 11-ой международной конференции и выставке «Цифровая обработка сигналов и ее применение». Москва, Россия 24-26 марта 2009 г., на 9-ой международной научно-практической конференции "Эффективные инструменты современных наук". Прага, Чехия 27 апреля - 05 мая 2013г. и 9-ой международной научно-практической конференции «Европейская наука XXI века». Пшемысль, Польша 07-15 мая 2013г.
Публикации. Основные материалы диссертации изложены в пяти публикациях, среди которых три статьи, две из них опубликованы в журналах из перечня ВАК ведущих рецензируемых научных журналов и изданий, и два текста докладов, опубликованных в материалах конференций.
Структура и объём работы. Диссертационная работа состоит из введения, четырёх разделов, заключения, списка литературы, включающего 60 наименований. Диссертация изложена на 160 страницах, содержит 77 рисунков и 48 таблиц.
1. Обзор методов шумоподавления в устройствах индивидуальной слухокоррекции
1.1 Общие положения
Широко известно [4], что нарушения слуха наиболее тяжело сказываются на индивидууме. При нарушении зрительного восприятия человек остается в общественных отношениях, строящихся на общении при помощи речи. При нарушении слуха уровень общественных отношений значительно понижается. Речь является основным способом общения между людьми. Даже общая отсталость умственного развития не отдаляет индивидуума от общества так, как потеря способности общения при помощи речи. Кроме того известно из [5], что проявившееся в раннем возрасте нарушение слуха, без должной коррекции и лечения, неизбежно влечет задержку умственного и психического развития ребенка.
В соответствии с [6] речевые сигналы — это совокупность элементов акустической энергии с быстро меняющимися амплитудами и частотами.
Звуки речи различаются по особенностям их психоакустических свойств: высоты, силы, тембра и длительности. Отдельно следует выделить гласные звуки, волновая форма которых более проста, по сравнению с волновой формой согласного звука. Эта особенность состоит в том, что в спектре речевого сигнала присутствуют кратные, т.е. периодические составляющие для вокализированных временных интервалов.
Огибающая спектральных составляющих гласных звуков неравномерна и, как правило, обладает локальными максимумами, которые называются формантами. Согласно [7,8], форманта - это определенная частотная область, в которой находится некоторое число гармоник основного тона, производимого голосовыми связками и усиленного вследствие резонанса в полости рта. Из [4, С. 60]«Так, звуки «у» и «ы>> характеризуются низкими
формантами — от 200 до 600 Гц. Звук «а» независимо от того, голосом какой высоты он произнесен, обладает своеобразной формантой в области от 1000 до 1400 Гц. Спектры согласных звуков имеют более сложные акустические характеристики. Наряду с периодическими колебаниями звонким согласным свойственны непериодические колебания высокой частоты. Для других согласных («п», «ш» и др.) характерны только непериодические колебания различной частоты».
Основная частота голоса foT или частота основного тона (ОТ) определяет частоту следования импульсов, генерируемых голосовыми связками. В среднем для мужского голоса Íot = 80-120 Гц, для женского — 140-150 Гц. Первая и вторая форманты речи соответственно обозначаются как PI и Р2. Они определяют область частот, на которых в спектре речевых звуков обнаруживаются максимумы.
Чтобы звуковые колебания могли стать средством общения между людьми, они должны как-то отличаться и состоять из каких-либо отдельных звуковых единиц. Согласно современной теории речеобразования и восприятия речи, такими звуковыми единицами являются фонемы [4,9,10]. Последовательность фонем образует слово, а последовательность слов — сообщение. Изменение порядка следования фонем или их числа приводит к изменению слова.
Для каждого языка характерно определенное число звуковых единиц. Так, в русском языке имеется 35 согласных и 6 гласных фонем, в немецком — 24 согласные и 15 гласных фонем, в английском насчитывается 33 согласных дифтонга и 12 гласных фонем. Каждая фонема имеет свой спектр, в котором форманты располагаются в определенном диапазоне частот. При этом, несмотря на наличие межиндивидуальных различий в спектральной картине отдельных звуков речи, произнесенных женщиной, мужчиной или ребенком,
частотные и амплитудные соотношения между отдельными формантами, их длительность и характер изменений практически остаются стабильными. Именно поэтому звуки речи относительно легко распознаются человеком. Максимальное число формант в спектре речи может достигать семи, однако для распознавания отдельных фонем наиболее важными являются только первая, вторая и третья форманты.
Распознавание речи у человека, как следует из многочисленных экспериментальных и теоретических исследований, по-видимому, происходит последовательно в два этапа. Сначала слуховая система осуществляет перевод простых физических или акустических признаков речевого сигнала в дискретный ряд фонем. На втором этапе происходит непосредственный перевод фонем в языковую единицу [11].
Чтобы речь была услышана, ее уровень должен быть выше порога слышимости или порога обнаружения. Только в этом случае слушающий начинает различать отдельные слова.
Основным методом количественной оценки разборчивости речевых сигналов является артикуляционный метод, согласно которому определяют количество слогов, слов или предложении, произнесенных диктором или записанных на магнитный носитель и правильно повторенных слушателем. Разборчивость речи выражают через коэффициент - разборчивости или в процентах.
При классификации нарушений слуховой функции можно руководствоваться разными принципами:
1) степенью понижения слуха;
2) характером нарушения;
3) локализацией процесса в слуховом анализаторе;
4) причинами поражения слуха;
5) состоянием развития речи.
Нарушение восприятия на слух звуковой речи также выражается в различной степени — от незначительного снижения восприятия шепотной речи до резкого ограничения возможности восприятия речи разговорной громкости.
В [12,13,14] различают два вида недостаточности слуховой функции: глухоту и тугоухость. «Обычно глухотой обозначают такую степень снижения слуха, при которой отсутствует речевая разборчивость даже при использовании слухового аппарата или других средств звукоусиления. Однако отдельные очень громкие звуки такие больные могут слышать. Абсолютная невозможность восприятия любых звуков встречается редко.
Тугоухостью называют понижение слуха различной степени выраженности, при котором восприятие речи затруднено, но все же возможно при создании определенных условий (приближение говорящего к тугоухому, применение слухового аппарата или другой звукоусиливающей аппаратуры)».
Обратимся к современным аудиологическим понятиям. Понятие «глухота» часто используется как общее для обозначения всех видов и степеней нарушения слуха. Его содержание определить сложно, поэтому при обозначении генетически обусловленных нарушений слуха его следует избегать. То же касается понятия «потеря слуха». При многих генетически обусловленных нарушениях слух никогда нормально не функционировал, а следовательно, некорректно говорить о его потере. Поэтому вместо этих понятий рекомендуется использовать понятие, выраженное словосочетанием «нарушение слуха».
1.2 Устройства индивидуальной слухокоррекции. Этапы и
назначение
Для людей с нарушениями слуха достаточно давно применяются специальные устройства. Из [5] известны примеры применения различных акустических усилителей без привлечения элекроусилительных элементов. Данные устройства базировались на принципе концентрации энергии звукового сигнала и представляли собой конические трубы, «слуховые рожки» и т.п.
Можно выделить следующие основные технологические этапы развития производства слуховых аппаратов (в хронологическом порядке появления новых модификаций):
1650 г. — первое механико-акустическое устройство — слуховая трубка;
1869 г. — электроакустический слуховой аппарат (настольный);
около 1900 г. — костный слуховой аппарат;
50-е гг. XX в. — заушный слуховой аппарат на транзисторах;
60-е гг. — внутриушной аппарат;
80-е гг. — аппарат с цифровым программированием;
90-е гг. XX в. — аппарат с цифровым процессором обработки речи.
Среди наиболее широко используемых в практике слухопротезирования способов обработки и передачи акустической информации[15] условно можно выделить следующие:
- линейное широкополосное или частотное избирательное усиление звуковых сигналов с ограничением или без ограничения их уровня;
- полосовая частотная фильтрация звуков речи, при которой слабослышащему или глухому подают усиленные сигналы только в том
диапазоне частот, который он может наиболее эффективно воспринимать;
-смещение высокочастотной части речевого спектра в низкочастотную область воспринимаемых звуков;
- нелинейное усиление звуков речи, которое заключается в компрессии их амплитуды в широком диапазоне частот;
- многоканальное частотно-избирательное полосовое усиление с амплитудной компрессией сигналов по входу или выходу, регулируемым порогом и коэффициентом компрессии в каждом частотном канале;
- применение дихотических способов протезирования с целью использования основных преимуществ бинаурального слуха.
1.3 Методы шумоподавления используемые в слуховых аппаратах
Из [16,17,18] известно, что фоновый шум снижает разборчивость речи и, что чем выше уровень фонового шума, тем больше снижение разборчивости. Мы способны понимать речь в умеренно шумной окружающей среде, потому что речь обладает высокой информационной избыточностью и, следовательно, даже если часть речевого сигнала маскируется шумом, другие части речевого сигнала будут передавать достаточное количество информации, чтобы сделать понятной речь. Существенно меньше избыточность в речевом сигнале, воспринимаемом человеком с нарушениями слуха. Если воспринимаемая часть речевого сигнала сильно искажена шумом, то информационно обедневший вследствие нарушений слуха сигнал возможно не будет правильно интерпретирован человеком.
Как следствие, люди с нарушениями слуха имеют гораздо большую трудность в восприятии речи в шумах чем нормально слышащие люди.
Слуховые аппараты дают возможность в некоторой степени уменьшить влияния шума. Современная технология изготовления цифровых слуховых аппаратов на микропроцессорах открывает значительные новые возможности по использованию передовых методов обработки сигналов для снижения уровня шума [19,20].
Общая проблема снижения шума не является новой и достаточно глубоко рассмотрена с учётом статистических особенностей сигналов [21, 22]. Данная проблема занимает центральное место в области теории информации и теории кодирования. Следовательно, существует значительный объем теоретических знаний и методов практической реализации, для решения этой проблемы. К сожалению, проблема принципиально очень трудна для наиболее распространенных типов акустических шумов. Кроме того существуют жесткие ограничения на возможность увеличения отношения сигнал-шум. С другой стороны, есть некоторые особенности, касающиеся как слуха, так и фонового шума, влияющие на разборчивость речи и позволяющие выработать стратегии обработки сигналов, которые могут быть полезны в слуховых аппаратах. Цель большинства методов заключается не столько в создании устройств подавления шума, сколько в уменьшении влияния фонового шума на разборчивость и общее качество звука [23,24].
В первую очередь необходимо определить, что в рамках данной работы понимается под понятием шум. Шум представляет собой любой нежелательный сигнал, препятствующий восприятию (приему) полезного сигнала, которым является речь. Основной интерес фокусируется на трех типах шума, которые способны сильно уменьшить разборчивость речи:
1). Случайный шум, спектральная плотность которого близка к спектру речевого сигнала.
2). Голосовая помеха. Следует отметить, что помехи создаваемые множеством других голосов, имеют физические характеристики случайного шума с формой спектральной огибающей близкой к огибающей спектра речевого сигнала.
3). Реверберационные шумы представляют собой совокупность звуковых сигналов, появившихся в результате отражения полезного сигнала от стен, полов, потолков, столешниц и других твердых поверхностей. В некоторых пределах реверберация может помочь в восприятии речевого сигнала, но слишком сильная реверберация сигнала снизит разборчивость речи и общее качество звука особенно в присутствии шумов других типов.
Для изложения принципов подавления шума в слуховых аппаратах, необходимо иметь базовое понимание того, как слуховая система обрабатывает звук. Периферическая слуховая система анализирует звук посредством банка перекрывающихся, узкополосных фильтров. Эти фильтры выделяют критические полосы слуха [11].
Точная форма и ширина этих фильтров по-прежнему является предметом многих исследований [25,26,27,28,29].
Следует понимать, что данные фильтры хоть и похожи на 1/3-октавные фильтры, но обладают более узкой полосой пропускания. Кроме того АЧХ критических полос асимметрична относительно максимума. Как следствие, максимум АЧХ критической полосы сосредоточен на более высокой частоте.
Внутри критической полосы происходит интегрирование по частоте, т.е. человеком воспринимается доминирующая спектральная составляющая, все остальные составляющие спектра маскируются [10,26,27,28]. На данном
принципе работают системы перцептуального кодирования звуковых сигналов, например, MPEG1 layer 3 [30].
1.3.1 Метод фиксированных фильтров для стационарных шумов
Частотный спектр окружающего шума часто является стационарным. Если спектры шума и речи существенно отличаются и, например, шум сосредоточен в низкочастотной области, то можно применить фильтр верхних частот, который устранит данный шум. Та небольшая часть речевого сигнала, которая будет подавлена не окажет большого влияния на разборчивость речи, если шум сосредоточен ниже 500Гц. Согласно [9], для всего диапазона частот ниже 0,4 кГц наличие шума в речевом сигнале не дает негативного вклада в разборчивости. Шумовые компоненты же в этой области частот наиболее интенсивны и устранение этих компонент будет иметь желаемый эффект снижения шумового воздействия и повышения общего качества звучания.
1.3.2 Многополосная фильтрация
Частотный спектр повседневно встречающихся шумов редко сильно отличается от спектра речи и достаточно быстро меняется во времени, так что фиксированный фильтр высоких частот не может эффективно устранить большую часть шума без снижения речи разборчивости [31]. Из [32,33,34,35] достоверно известно, что существует способ уменьшить уровень шума без существенного снижение разборчивости. Он состоит в получении, в некотором роде, оценки спектра шума, а затем в ослабления полос частот, в которых уровень шума превышает уровень речи [30,35,36,37]. Этот подход может также быть использован для уменьшения реверберации путем определения групп частотных полос с чрезмерной реверберацией, а затем ослаблением этих групп [38].
Информацию о различии сигналов речи и шума можно получить из пространственного положения источников полезного сигнала и шума, используя пару разнонаправленных микрофонов или массивов микрофонов, один направлен в сторону источника полезного сигнала, в который поступает смесь сигнала с шумом, другой микрофон направлен так, чтобы в него поступал только шум. Система фильтрации будет производить спектральное вычитание сигналов, получая очищенный полезный сигнал. Данный тип фильтрации можно назвать адаптивным [39,40]. Он проявляет себя максимально положительно, за исключением использования в комнатах малых объемов с большим количеством ранних отражений высокого уровня.
1.3.3 Перцепционное шумоподавление
Существует возможность использования некоторых аспектов речевого сигнала для разработки более совершенных систем шумоподавления [41]. В них применено наше знание о речевом сигнале, а именно его фонетические, лингвистические, статистические особенности и прочие аспекты, используемые в технологии распознавания речи [42,43]. В том числе использовать особенность состоящей в том, что в спектре речевого сигнала присутствуют кратные, т.е. периодические составляющие для вокализированных участков речи. Между тем в ряде технических приложений используется периодичность спектра источника сигнала для выделения информации о свойствах источника [44,45,46], о его местоположении [3]. Периодичность речевого сигнала позволяет использовать согласованный гребенчатый фильтр для выделения сигнала из смеси с шумами [47,48, 49]. Данный метод требует определения частоты ОТ, который достаточно глубоко исследован [50]. Однако остался ряд вопросов о влиянии выбранной частоты дискретизации на значение точной оценки частоты или периода ОТ и ее применимости к задаче фильтрации.
Таким образом, необходимо решить практическую задачу адаптации этих методов и, в частности, метода построения согласованного гребенчатого фильтра с целью повышения разборчивости речи в системах распознавания и в устройствах индивидуальной слухокоррекции.
1.4 Выводы
Из произведенного критического обзора методов применяемых при разработке слуховых аппаратов и средств слуховой коррекции, следует отметить следующие особо значимые моменты:
-На текущем этапе развития средств слуховой коррекции среди всех задач преобразования звуковой информации, обеспечивающих улучшение восприятия звука больным, доминирующей можно назвать задачу выделения полезного речевого сигнала на фоне шумов.
-Для решения данной задачи широко распространены системы, основанные на пространственной селекции полезного сигнала и шума, использующие несколько разнонаправленных микрофонов, с дальнейшей процедурой спектрального вычитания
-На современной стадии развития систем слуховой коррекции начинает активно внедряется использование фонетических, лингвистических, статистических особенностей речи и прочих аспектов, используемых в технологии распознавания речи.
Похожие диссертационные работы по специальности «Приборы и методы преобразования изображений и звука», 05.11.18 шифр ВАК
Алгоритмы обработки речевых сигналов телекоммуникационных систем в условиях помех2022 год, кандидат наук Холкина Наталья Евгеньевна
Предобработка речевых сигналов в системах автоматической идентификации диктора2015 год, кандидат наук Тупицин Геннадий Сергеевич
Модель, численная и программная реализация оценивания частоты основного тона речевого сигнала с помощью сингулярного спектрального анализа2015 год, кандидат наук Вольф Данияр Александрович
Высокоэкономичные функциональные узлы автономных аппаратов и элементов автоматики: Развитие теории, исследование, разработка2001 год, доктор технических наук Галиев, Анвар Лутфрахманович
Алгоритмы повышения эффективности передачи речевой информации в корабельных оперативно-командных системах громокоговорящей связи2010 год, кандидат технических наук Быков, Артем Александрович
Список литературы диссертационного исследования кандидат наук Чесноков, Михаил Александрович, 2013 год
Список литературы
1. Рассказов И.Ю., Искра А.Ю., Калинов Г.А., Аникин П.А., Гладырь А.В., Рассказов М.И., Сидляр А.В. Особенности регистрации и обработки данных геоакустического контроля массива горных пород на действующем руднике // Горный информационно-аналитический бюллетень - 2011- №7. С. 212-218.
2. Лоскутова Г.В., Полканов К.И. Пространственно-частотные и частотно-волновые методы описания и обработки гидроакустических полей. СПб.: Наука, 2007., 239с.
3. Бакулев П.А. Радиолокационные системы. М.: Радиотехника, 2004.
4. Руленкова Л.И., Смирнова О.И. Аудиология и слухопротезирование. — М.: Академия, 2003. - 208 с.
5. Таврткиладзе Г.А., Гвелесиане Т.Г. Клиническая аудиология. - М.: Святигор Пресс, 2003-74с.: ил.
6. Оториноларингология: учебник/ Под ред. И.Б. Солдатова, В.Р. Гофмана.
- СПб: ЭЛБИ, 2000. ISBN 5-7733-0033-8
7. Вахитов Я. Ш. Слух и речь. - Л.: ЛИКИ, 1973.- 122 с.
8. Бондарко Л. В., Вербицкая Л.А, Гордина М. В. Основы общей фонетики.
— 4-е изд., СПб: Академия,2004, 160с.
9. Фант Г. Акустическая теория речеобразования. - М.: Наука, 1964. - 284с.
10. Lieberman Ph., Blumstein S.E. Speech physiology, speech perception and acoustic phonetics. Cambridge, 1988.
12. Слуховая система / Ред. Я.А. Альтман: Л., Наука, 1990 - 620 стр.
13. Нейман JI.B., Богомильский М.Р. Анатомия, физиология и патология органов слуха и речи. - М.: Владос, 2001. - 224 с
14. Богомильский М.Р., Сапожников Я.М. Современные методы диагностики, лечения и коррекции тугоухости и глухоты у детей. — М., 2001.
15. Жилинский Ю. П. Технические устройства для оказания помощи людям с нарушенной слуховой функцией. Реабилитация инвалидов по слуху. - JL, 1980.
16. Gengel RW. Acceptable speech-to-noise ratios for aided speech discrimination by the hearing impaired. J Speech Hear Res 1971 ;№11, pp: 219222.
17. Plomp R. A signal-to-noise ratio model for the speech-reception threshold of the hearing impaired. J Speech Hear Res 1986;№29, pp: 146-154.
18. Humes LE. Understanding the speech understanding problems of the hearing impaired. J Amer Acad Audiol 1991; №2, pp: 59-69.
19. Levitt H. Advanced signal processing hearing aids. In: Beilin J,Jensen GR (eds.). Recent developments in hearing instrument technology, Proc 15th Danavox Symposium. Copenhagen: Stougaard Jensen, 1993.
20. Levitt H. Noise reduction in hearing aids: a review. Journal of Rehabilitation Research and Development Vol. 38 No. 1, January/February 2001, pp: 111-121
21. Van Trees HL. Detection, estimation and modulation theory. New York: Wiley, 1968.
23. Dillon H, Lovegrove R. Single microphone noise reduction systems for hearing aids: A review and an evaluation. In: Studebaker GA, Hochberg I (eds.). Acoustical factors affecting hearing aid performance, second edition. Boston: Allyn and Bacon, 1993.
24. Weiss M, Newman AC. Noise reduction in hearing aids. In: Studebaker GA, Hochberg I (eds.). Acoustical factors affecting hearing aid performance, second edition. Boston: Allyn and Bacon, 1993.
25. Бекеши Г., Розеиблит В.Л. Механика улитки // Экспериментальная психология. М., 1963.
26. Электрические модели улитки органа слуха. Молчанов А.П., Бабкина Л.Н. Л., «Наука», 1978. 181 с.
27. Цвиккер Э., Фельдкеллер Р. Ухо как приемник информации. М. 1971
28. Королева И.В. Введение в аудиологию и слухопротезирование / И.В.Королева. СПб.:КАРО, 2012.- 343 с. Илл.-175.
29. Алдошина И. Основы психоакустики. Оборонгиз., М., 2000. - 154с.
30. ISO/IEC 11 172-3, "Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 3: Audio," first edition, Aug. 1993.
31. Neuman AC, Schwander TJ. The effect of filtering on the intelligibility and quality of speech in noise. J Rehabil Res Dev 1987;№24(4), pp:127-134.
32. Ono H, Kanzaki J, Mizoi K. Clinical results of hearing aid with noise-level-controlled selective amplification. Audiology 1983;№22, pp:494-515.
34. Gagne J-P. Excess masking among listeners with a sensorineural hearing loss. J Acoust Soc Am 1988;83:2311-21
35. Fabry DA, Leek MR, Walden BE, Cord M. Do adaptive frequency response (AFR) hearing aids reduce 'upward spread' of masking? J Rehabil Res Dev 1993;30(3):318-25.
36. Romain Serizel, Integrated active noise control and noise reduction in hearing aids, Thesis, Katholieke Universiteit Leuven, 2011.
37. Graupe D, Grosspietsch JK, Basseas SP. A single-microphonebased self-adaptive filter of noise from speech and its performance evaluation. J Rehabil Res Dev 1987;24(4): 119-126.
38. Neuman AC, Eisenberg L. Evaluation of a dereverberation technique. J Commun Disord 1991; №24, pp: 211-221.
39. Уилдроу Б., Стирнз С. Адаптивная обработка сигналов: Пер. с англ. -М.: Радио и связь, 1989. - 440 е.: ил.
40. Адаптивные фильтры: Пер. с англ./Под ред. К.Ф.Ню Коуэна и П.М. Гранта. - М.: Мир, 1988. - 392с.,ил.
41. Levitt Н. Advanced signal processing hearing aids. In: Beilin J,Jensen GR (eds.). Recent developments in hearing instrument technology, Proc 15th Danavox Symposium. Copenhagen: Stougaard Jensen, 1993.
42. Гребнов, С. В. Методы шумоочистки в задачах распознавания речи. / С. В.Гребнов // Тезисы докладов Международной научно-технической конференции "Состояние и перспективы развития электротехнологии" (XV Бенардосовские чтения), 27-29 мая / Федеральное агенство по образованию, ИГЭУ. - Иваново.- 2009. - Т.1 - С. 60-61.
43. Прохоренко, Е.И. Цифровое кодирование клиппированной речи с сохранением разборчивости и узнаваемости диктора / Е.И. Прохоренко, И.А. Сидоренко, А.В. Болдышев ; БелГУ // Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. - 2008. - №17, вып.8.-С. 9196.
44. Марпл-мл. С. Л. Цифровой спектральный анализ и его приложения / Пер. с англ. - М.: Мир, 1990.
45. Рассказов И.Ю., Искра А.Ю., Калинов Г.А., Аникин П.А., Гладырь А.В., Рассказов М.И., Сидляр А.В. Особенности регистрации и обработки данных геоакустического контроля массива горных пород на действующем руднике // Горный информационно-аналитический бюллетень - 2011- №7. С. 212-218.
46. Маковеева М.М., Шинаков Ю.С. Системы связи с подвижными объектами: Учебное пособие для вузов. - М.: Радиосвязь. 2002. - 440 е.: ил.
47. Финкелыптейн М. И. Гребенчатые фильтры. М., «Советское радио», 1969, 320 стр.
48. A. Nehorai and В. Porat, "Adaptive comb filtering for harmonic signal enhancement," IEEE Transactions on Signal Processing, vol. 34, pp. 1124-1138, 1986.
49. Brian King, Enhancing Single-Channel Speech in Wind Noise Using Coherent Modulation Comb Filtering, MSEE Thesis, University of Washington, 2008.
50. Бабкин В.В. Помехоустойчивые выделители основного тона для низкоскоростных вокодеров и цифровых слуховых аппаратов. Автореферат диссертации на соискание ученой степени к.т.н. Государственный технический университет связи и информации им. проф. М.А.Бонч-Бруевича 2003 г.
52. Ashby, Michael, & John Maidment. Introducing Phonetic Science. Cambridge: CUP, 2005
53. Березин И.С., Жидков Н.П. Методы вычислений. Т.1.- М.: Наука, 1966.
54. Рабинер П., Гоулд Б. Теория и применение цифровой обработки сигналов. М.:Мир, 1978.
55. Рабинер Р., Шафер Р. Цифровая обработка речевых сигналов: Пер. с англ. М.: Радио и связь, 1981. 495 с.
56. Секунов Н. Ю. Обработка звука на PC. - СПб.: БХВ-Петербург, 2001. -1248 е.: ил.
57. Гери М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. Пер. с англ. - Москва. "МИР" 1982.
Список публикаций автора по теме диссертации
58. Чесноков, М.А. Применение алгоритма помехоустойчивого определения частоты основного тона для повышения контрастности зашумленных речевых сигналов / Нурмухамедов JI.X., Смирнов E.JL, Чесноков М.А. // Радио-электроника интеллектуальных транспортных систем. -2010. -№3. -С. 18-23.
59. Чесноков, М.А. Динамическая фильтрация элементов речевых сигналов и сигналов с непериодическим линейчатым спектром / Кривошейкин A.B., Молчанов А.П., Чесноков М.А. // Научно-технические ведомости СПбГПУ. -2012. -№4. -С.75-79.
60. Чесноков, М.А. Определение периода основного тона в устройствах шумоподавления речевых сигналов / Кривошейкин A.B., Чесноков М.А. // Мир техники кино. -2013. -№29. -С.4-7.
61. Чесноков, М.А. Система оптимального фильтрации речевого сигнала на основе линии задержки с отводами / Кривошейкин A.B., Чесноков М.А. // Текст доклада в материалах международной научно-практической конференции «Европейская наука XXI века», Пшемысль (Польша), 07-15 мая 2013, Т. 29, С. 32-34.
62. Чесноков, М.А. Получение произвольной длины линии задержки в цифровом гребенчатом фильтре на основе интерполяционного многочлена Лагранжа / Кривошейкин A.B., Чесноков М.А. // Текст доклада в материалах международной научно-практической конференции «Эффективные инструменты современных наук», Прага (Чехия), 27 апреля - 05 мая 2013, Т. 43,С. 3-5.
Листинг программы гребенчатой фильтрации для заданного значения длины линии задержки
% fs=8e3; % Частота дискретизации % д=0. 7; % Коэффициент в цепи обратной связи
% delay=23;
% data % Входной сигнал
% data=0.9*data./max(abs(data)); % нормировка входного незашумленного сигнала
% snr=150; % ОСШ входного сигнала в полосе до 4кГц (шум белый)
% snr_r=snr-10*logl0(fs/(2*4еЗ)); % s=awgn(data,snr_r,'measured'); % т.о. задается входное отношение сигнал-шум
out=zeros(1,length(s)); % создание пустого массива для выходного сигнала
dllm=640; % полная длина линии задержки % dll=134; % текущее значение линии задержки dl=zeros (1, dllm) ; % Линия задержки (JI3) ГФ dlc=l; % Переменная счета JI3 ГФ tc=0;
temp=0; % временная переменная сумматора ГФ slength=length(s); % длина входного массива
for i=l:1:slength-1;
%%% гребенчатый фильтр "начало" %%% dll=round(delay);
dlc=mod(die,dllm); % ограничение счетчика записи в JI3 no длине JI3
dlc=dlc+l; % инкрементация счетчика записи
в JI3
tc=mod (tc, dllm) +1; %
temp=s(i)+dl(tc); % суммирование
out(i)=temp; % запись в выходной массив
%%% гребенчатый фильтр "конец" %%%
end;
Листинг программы гребенчатой фильтрации с внедрением интерполяционного алгоритма для заданного значения длины линии задержки
% fs=8e3; % Частота дискретизации % д=0.7; % Коэффициент в цепи обратной связи
% delay=23;
% data % Входной сигнал
% data=0.9*data./max(abs(data)); % нормировка входного незашумленного сигнала
% snr=150; % ОСШ входного сигнала в полосе до 4кГц (шум белый)
% snr_r=snr-10*logl0(fs/(2*4еЗ));
% s=awgn(data,snr_r,'measured'); % т.о. задается входное отношение сигнал-шум
out=zeros(1,length(s)); % создание пустого массива для выходного сигнала
dllm=640; % полная длина линии задержки % dll=134; % текущее значение линии задержки dl=zeros (1, dllm) ; % Линия задержки (JI3) ГФ dlc=l; % Переменная счета JI3 ГФ tc=0;
temp=0; % временная переменная сумматора ГФ
N=5; % число точек интерполяции в ГФ
k—fix(N/2); % округление в меньшую сторону от N/2
wi=zeros (1 ,N) ; % значения функции в JI3 в области анализа интерполятора
delays=zeros(1,N); % значения задержек для отводов ЛЗ в области интерполятора
slength=length(s); % длина входного массива for i=l:1:slength-1;
%%% гребенчатый фильтр "начало" %%%
dlc=mod(dlc,dllm); % ограничение счетчика записи в JI3 по длине ЛЗ
dlc=dlc+l; % инкрементация счетчика записи
в JI3
dl (die) =temp*g; % ввод нового значения в JI3 ГФ
dll=fix(delay); % получение номера наиближайшего в меньшую сторону отсчета по требуемой задержке tc=dllm-dll+dlc; % if dll~=delay tc=tc-l;
delay_c=dll+l-(delay-dll);
else
de1ay_c=de1ay;
end
tc=mod(tc/dllm) ; %
for j=l:l:N
delays(j)=dll-k-l+j;
tis(j)=tc-k-l+j;
tis(j)=mod(tis(j),dllm)+l;
wi(j)=dl(tis(j)) ;
end;
% расчет требуемого значение функции из JI3 при помощи полинома Лагранжа res=0; for 1=1:1:N temp=l; for m=l:1:N if l~=m
temp=temp* (delays-delays (m)) / (delays (1) -delays (m)) ; end;
end;
res=res+wi(1)*temp;
end
temp=s(i)+res; % суммирование out(i)=temp; % запись в выходной массив
%%% гребенчатый фильтр "конец" %%%
end;
Листинг программы поиска периода основного тона по заданному входному массиву
fs=8e3; % Частота дискретизации
% snr=120; % ОСШ входного сигнала в полосе до 4кГц (шум белый)
% snr__r=snr-10*logl0 (fs/ (2*4еЗ)) ;
% S—awgn(data,snr_r,1measured'); % т.о. задается входное отношение сигнал-шум
р=128; % интервал, с которым повторяются выборки анализа ОЧОТ, выраженное числом отсчетов
% при р < h происходит наложение последовательно идущих окон анализа
h=256; % число отсчетов анализа ОЧОТ
w±ndow=hann(h)'; % функция окна используемая при
анализе
v=zeros(1,h); % массив анализа ОЧОТ со значения входного сигнала
cmax=round(fs/75); % максимальное значение для локального максимума АКФ
cmin=round(fs/350); % минимальное значение для локального максимума АКФ
kf=4; % коэффициент разрещающей способности относительно числа отсчетов анализа ОЧОТ (fft(...,kf*fs))
fbmax=round(350/(fs/kf/h)); % максимальное значение частоты ОТ выраженное в отсчетах БПФ fbmin=round(70/(fs/kf/h)); % минимальное значение частоты ОТ выраженное в отсчетах БПФ
М=7; % число точек для апроксимации в ОЧОТ
u=fix(М/2); % округление в меньшую сторону от М/2
twa=zeros(1,М) / % временная переменная для уменьшения числа действий
tas=l:l:M; % массив с номерами отсчетов автокорреляционной функции для аппроксиматора tas2=tas.А2; tas3=tas.А3; tas4=tas.А4;
sum_tas=sum (tas) ; sum_tas2=sum(tas2) ; sum_tas3=sum(tas3) ; sum_tas4=sum(tas4) ;
MAT= [sum_tas2 sum_tas M; sum_tas3 sum_tas2 sum_tas ; sum_tas4, sum_tas3, sum_tas2] ; % первичная матрица MATa=MAT; МАТЬ=МАТ; MATc=MAT;
dMAT=det (МАТ) ; % определитель первичной матрицы
slength=length(s); % длина входного массива
cand_hist=zeros(1,fix((slength-h)/р)); % массив грубо оценных значений периодов основного тона cand_count=0;
delay_hist=zeros(1,fix((slength-h)/р)); % массив уточненных значений периодов основного тона nflocmax_hist=zeros(1,fix((slength-h)/р)); % массив количества найденных локальных максимумов в спектре входного сигнала х hist=l:1:length(cand hist);
medcmas=zeros(1,3); % массив медианного фильтра для кандидатов на период ОТ
meddmas=zeros(1,3); % массив медианного фильтра для периодов ОТ
for i=l:1:slength-h;
%%% Определитель частоты основного тона "начало"
%%%
if mod (i ,р) ==0
cand_count=cand_count+l;
if (slength-i)>h % проверка достаточно ли отсчетов в для выборки
v=s(i:i+h-1);
v=v.*window; % почленное умножение значений из выборки на функцию окна
V=fft(v,kf*h); % ПБПФ от анализируемой
выборки
Vw=V.*conj(V); % домножение всех отсчетов БПФ на их комплексно сопряженные числа
[fA,fpos]=max(Vw(l:kf*h/2)); % поиск глобального максимума спектра входного сигнала
vVw=real(ifft(Vw,kf*h)); % получение взаимной автокорреляционной функции
vVw=vVw./max(abs(vVw)); % ее нормировка (не обязательно, но для красоты графиков)
[А,pos]=max(vVw(cmin:сшах)); cand=pos+cmin-2; % определение позиции локального максимума,
% который отвечает за текущее значение периода основного
% тона
cand_hist(cand_count)=cand;
% расчет коэффициентов аппроксимационной кривой (параболы) для
% определенной раннее локального максимума автокорреляционной функции
wa=vVw(cand-u:cand+u); % расчет вектора столбца к первичной
матрице
эит_уа=8ит(ка) ; twa=wa.; % временная уменьшения числа действий
sum_wa_tas=sum(twa); twa=twa.*1аэ; % временная уменьшения числа действий
зит__»га_Ьа82=8ит(Ъка) ;
МАТ а (1,1) =вгш1_»а ; МАТа (2,1) =зит_>га_Ьаз ; МАТ а (3,1) =sum_wa_tas2 ;
МАТЬ (1,2) =зшо_*а ; МАТЬ (2,2) =зит_ета_Ьаз ; МАТЬ(3,2)=бит_*а_1аБ2;
% необязательно
%------------------------
МАТ с (1,3) =вит_>га ; МАТс(2,3)=зит_*а_Ьаз;
МАТ с (3,3) =зит_**а_Ьаз2 ;
%------------------------
% получение коэффициентов производной от аппроксимационного полинома
а=2*<1еЪ (МАТа) /сЗМАТ ; Ь=с1еЪ (МАТЬ) /сЗМАТ;
% получение коэффициентов для красивого графика в статью
% необязательно
%------------------------
ар=а/2; Ьр=Ь;
cp=det (МАТс) /сЗМАТ ;
%------------------------
% расчет необходимого периода времени для
епа;
переменная для
end;
end;
Листинг программы к реализации алгоритма самоподстраиваемой гребенчатой фильтрации на базе сигнального процессора Shark ADSP 21369
#include <math.h> #include <signal.h> #include <sport.h> #include <sysreg.h> #include <filters.h> #include <fract_typedef.h>
const float a = 0.7; int in[1024]; int ini[1024]; int outr[1024]; int outi[1024]; int LZ[2560]; int tsh;
bool fiill=true; int cand = 0; int r[1024]; int zaderjka; int lzgf[427]; int out;
/*Коэффициенты для КИХ фильтров: фильтра "после ГФ" и фильтра согласных*/
fractlöpm Coeffslp[41]={0x05bf,0xfbe5,0xf90f,0xf648,0xf5a0,0xf871,0xfe95, 0x062b,0x0cl3,0x0dle,0x0799,0xfc77,0xef9b,0xe6e5,0xe83c,0xf73c,0x136
а,
0x3 7bc,0x5bca,0x7646,0x7ffF,0x7646,Ox5bca,0x3 7bc,Ox 13 6a,0xf73c,0xe83
0xe6e5,0xef9b,0xfc77,0x0799,OxOdl e,OxOc 13,0x062b,0xfe95,0xf871,0xf5a
0,
0xf648,0xf90f,0xfbe5,0x05bf]; fractl6 pm coeffshp[43]={0x0353,0x0052,0xffec,0xff55,0xfeb4,0xfe3c,0xfe21, 0xfe85,0xff6d,0x00ba,0x0229,0x03 5e,0x03 fl ,0x03 88,0x01 ec,0xffl b,0xfb4c
j
0xf6f0,0xf29a,0xeeec,0xec73,0x6b95,0xec73,0xeeec,0xf29a,0xf6f0,0xfb4c, 0xfflb,0x01ec,0x0388,0x03fl,0x035e,0x0229,0x00ba,0xff6d,0xfe85,0xfe21
>
0xfe3c,0xfeb4,0xff55,0xffec,0x0052,0x0353};
#pragma align 16 int statehp[44]; int statelp[42];
int locmaxla[10]; int locmax2a[10]; int locmax3a[10]; int locmax4a[10]; int locmax5a[10];
int locmaxlz[10]; int locmax2z[10]; int locmax3z[10]; int locmax4z[10]; int locmax5z[10];
int k=0;
int schetchik=0; int schetchik2=0;
void ochot(int in[1024], int ini[1024]); void GF(int out);
/*Программа прерывания*/
LZ[schetchik]=sport_read( 1); schetchik++;
if (schetchik=2560) schetchik=0; k++;
if (k=512) {
k=0;
full=true;
}
GF(out);
out = fir(out,coeffslp, statelp, 41); if (cand=0)
out = out + fir(LZ[schetchik], coeffshp, statehp, 43); sport_write( 1, out);
}
main()
{ //Инициализация прерывания последовательного порта
asm("AX0=0x0000;");
asm("AX0=0x6B27;"); /*internal serial clock*/
asm("DM(0x3FF2)=AX0;"); /*RFS reqd, normal framing,*/
/*TFS reqd, normal framing,*/ /*internal RFS, TFS, mu-law*/ /*companding, 8-bit words*/
asm("AX0=0x0002;"); asm("DM(0x3 FF1 )=AX0;"); asm("AX0=255;"); asm("DM(0x3 FF0)=AX0;"); asm("AX0=0x0000;"); asm("DM(0x3 FEF)=AX0;"); asm("ICNTL=0x07;"); asm("IMASK=0x02;");
/*generate 2.048 MHz SCLK1*/ /*from 12.288 MHz CLKIN*/ /»divide by 256 for 8 kHz*/ /*sampling rate*/
asm("AX0=0x0C00;"); /*SPORTl enabled, PM wait*/
asm("DM(0x3FFF)=AX0;"); /*states 0, boot wait*/
int i;
/* enable power down interrupt and register ISR */ interrupt(SIGSPORT 1RECV, handler);
for (i=0; i < 44; i++) statehp[i]=0; for (i=0; i < 42; i++) statelp[i]=0; for (i=0; i < 427; i++) lzgf[i]=0; sport_start(l);
for (i=0; i<1024; i++) {
ini[i]=0; in[i]=0;
}
full=true;
//Начало основного цикла
while(l) {
if (full) {
full=false;
for (i=0; i<1024; i++) {
if (i > schetchik)
in[i]=LZ[2559 + (schetchik - i)];
else
in[i]=LZ[schetchik-i];
}
}
}
/""Подпрограмма ОЧОТ*/
void ochot(int in[1024], int ini[1024]) {
int i; int j; int 1;
float с = 0.943;
int price;
int maxprice = 0;
float prom = 1; int к = 0; int wsr = 0;
float alpha = 0.3;
fftl024(in,ini,outr,outi); //Вызов готовой (библиотечной) подпрограммы
БПФ
for (i=0; i<1024; i-H-y/Формирование энергетического спектра {
r[i]=(int)(((long)outr[i] *outr[i]+(long)outi[i] *outi[i])» 16); wsr=wsr+r[i];
}
for (j=5; j<32; ]++)//Поиск локальных максимумов {
if (k = 10) break;
if ((r[j]>rD-1 ])&&(r[j]>r[j+1 ])&&(25*r[j]>wsr) ) {
for (1=0; Kk; 1++) {
prom = prom*c;
}
/♦"Решающее правило"*/
for (i=0; i<10; i++) {
for (j=0; j<10; j++) {
for (1=0; K10; 1++) {
if ((abs(locmax3z[i]-locmax4z[j])>locmax3z[i]*alpha)
(abs(locmax3 z[j ] -locmax4z[l] )>locmax3 z[i] * alpha))
{
price=-1000000;
}
else
{
price=locmax3 a[i]+locmax4a[j ]+locmax5 a[l];
}
if (price > maxprice) {
maxprice=price; cand=locmax3z[i];
}
}
}
for (j=0; j<10; j++) {
for (1=0; 1< 10; 1++) {
if ((abs(locmax3 z[i] -locmax2z[j ])>locmax3 z[i] * alpha) (abs(locmax2z[j ] -locmax 1 z[l] )>locmax3 z[i] * alpha))
}
еЬе
{
рпсе=1осшахЗа[1]+1осшах2а[]]+1остах1а[1];
}
(рпсе > тахрпсе) {
тахрпсе=рпсе; сапё=1остахЗг[1];
}
}
}
}
1Г(сапё=0)
гаёецка =0;
еЬе
гаёецка = (т1)1024/сапё;
£ог 0=0; К10; {
1остах 1 а[1]=1остах2а[1];
1остах2а[1]=1остахЗ а[1];
1остахЗа[1]=1остах4а[1];
1остах4а[1]=1остах5а[1];
1остах5а[Г]=0;
1остах 1 г[1]=1остах22[1];
1остах22[1]=1остах32[1];
1остах32[1]=1остах42[1];
1осшах42[1]=1остах52[1];
1остах52[1]=0;
}
/»Процедура гребенчатого фильтра*/
void GF(int out) {
intN;
if (schetchik2<zaderjka)
N = schetchik2-zaderjka+426;
else
N = schetchik2-zaderjka;
if (zaderjka = 0)
out = LZ[schetchik];
else
out = LZ[schetchik]+a*lzgf[N]; lzgf[schetchik2]=out; schetchik2++;
if (schetchik2=427) schetchik2=0;
}
Протокол
Проведения 2 этапа исследований по договору «Определение помехоустойчивости восприятия речи пациентами с сенсоневральной тугоухостью»
Место испытаний:
Испытания проводились с 23 ноября по 16 декабря 2009 г. в Лаборатории слуха и речи НИЦ СПб ГМУ им. акад. И.П.Павлова
Объект испытаний:
Лица с нормальным слухом и больные с различными формами тугоухости, использующие цифровые слуховые аппараты.
Цель испытаний:
Определение эффективности приставки к СА для улучшения помехоустойчивости восприятия речи.
Программа испытаний ГПШ
1 .Подбор больных с патологией звукопроведения для проведения исследований по программе 2 этапа.
2. Проведение измерений разборчивости речевого сигнала с использованием специальной приставки при предъявлении фонетически сбалансированных речевых таблиц на фоне речевого шума, шума ветра и на фоне многоголосия. Соотношение сигнал/шум: 0, -6 и +6 дБ.
Методика испытаний
1. Измерения проводились на лицах с нормальным слухом и больных с различными формами тугоухости, отобранных при проведении 1 этапа исследований. Разборчивость речи оценивалась при предъявлении речевого сигнала в тишине и на фоне помехи методом экспресс - речевой аудиометрии.
Результаты испытаний:
Результаты испытаний представлены в таблицах 1 , 2, 3, 4 и 5.
Таблица 1. Разборчивость речи в тишине и на фоне помехи у лиц с преимущественно кондуктивным нарушением слуха.
Трек 3- без помехи; трек 4 - на фоне речевого шума, соотношение сигнал/ шум: ОдБ; Трек 5 - на фоне речевого шума, соотношение сигнал/шум: - 6дБ; трек 10 - на фоне шума ветра, сигнал/шум: ОдБ; трек 11 - на фоне шума ветра, сигнал/шум: - 6дБ; трек 16 - на фоне многоголосия, сигнал/шум: + 6дБ; трек 17 - на фоне многоголосия, сигнал/шум: ОдБ.
№ п/п Ф.И.О. Номер трека
3 4 5 10 11 16 17
1. Гундарева Г.С. 110, АБ 93.3 66.7 20 93.3 66.7 86.7 60
2 Кириллочкина АБ, БЬ 110 100 6.7 0 73.3 60 46.7 20
3 Бозина АБ, АигиБ 8+ 93.3 60 20 73.3 66.7 73.3 33.3
4 Блинкова АБ, И 401 46.7 6.7 0 46.7 33.3 46.7 26.7
5 Кузнецова, А8 60 0 0 46.7 33.3 6.7 6.7
78.7 28.0 8.0 66.7 52.0 52.0 29.3
Трек 4 - на фоне речевого шума, соотношение сигнал/ шум: ОдБ; трек 5 - на фоне речевого шума, соотношение сигнал/шум: - 6дБ; трек 10 - на фоне шума ветра, сигнал/шум: ОдБ; трек 11 - на фоне шума ветра, сигнал/шум: - 6дБ; трек 16 - на фоне многоголосия, сигнал/шум: + 6дБ; трек 17 - на фоне многоголосия, сигнал/шум: ОдБ.
№ п/п Ф.И.О. Номер трека
4 5 10 11 16 17
1 Мальцева АБ 60 60 86.7 100 80 100
2 Бердникова АБ 80 73.3 93.3 100 93.3 93.3
3 Алла А8 60 60 80 80 86.7 73.3
4 Ломоватская АЕ) 60 40 80 73.3 66.7 60
5 Морозова АБ 60 40 73.3 86.7 60 73.3
6 Квасова АО 40 60 73.3 86.7 73.3 80
7 Солдатова АО 60 60 80 80 60 93.3
8 Слесаренко А8 46.7 60 86.7 66.7 66.7 66.7
9 Кибалова АО 66.7 66.7 80 73.3 60 80
10 Кузнецова АБ 66.7 60 86.7 93.3 66.7 80
60.01 58.00 82.00 84.00 71.34 79.99
Таблица 3. Разборчивость речи (в %) на фоне помехи у лиц с сенсоневральной тугоухостью при использовании специальной приставки.
Трек 4 - на фоне речевого шума, соотношение сигнал/ шум: ОдБ; Трек 5 - на фоне речевого шума, соотношение сигнал/шум: - 6дБ; трек 10 - на фоне шума ветра, сигнал/шум: ОдБ; трек 11 - на фоне шума ветра, сигнал/шум: - 6дБ; трек 16 - на фоне многоголосия, сигнал/шум: + 6дБ; трек 17 - на фоне многоголосия, сигнал/шум: ОдБ.
№ Ф.И.О. Номер трека
4 5 10 11 16 17
1 Попов АБ,с/нР1 110 46.7 26.7 66.7 53.3 66.7 46.7
2 Соколов АБ,с/н 401 26.7 20 66.7 26.7 33.3 46.7
3 Белан, с/н АБ сю
4 Горохова с/н АО 401 33.3 20 60 53.3 26.7 26.7
5 Герлихман с/н АБ, Р1401 13.3 20 40 53.3 40 26.7
30.0 21.7 58.35 46.6 41.7 36.7
Таблица 4. Разборчивость речи (в %) на фоне помехи у лиц с преимущественно кондуктивными нарушениями слуха при использовании специальной приставки.
Трек 4 - на фоне речевого шума, соотношение сигнал/ шум: ОдБ; Трек 5 - на фоне речевого шума, соотношение сигнал/шум: - 6дБ; трек 10 - на фоне шума ветра, сигнал/шум: ОдБ; трек 11 - на фоне шума ветра, сигнал/шум: - 6дБ; трек 16 - на фоне многоголосия, сигнал/шум: + 6дБ; трек 17 - на фоне многоголосия, сигнал/шум: ОдБ.
№ Ф.И.О. Номер трека
4 5 10 11 16 17
1. Бозина, AS Aureus S+ 6.7 0 33.3 46.7 26.7 33.3
2. Гундарева AD Fl 110 40 20 66.7 66.7 66.7 26.7
3. Блинкова 6.7 0 53.3 53.3 33.3 20
4. Кириллочкина 40 33.3 80 53.3 46.7 40
5. Кузнецова 0 0 6.7 13.3 6.7 13.3
18.7 10.7 48.0 46.7 36.0 26.7
Таблица 5. Средние значения разборчивости речи (в%) при предъявлении речевого сигнала на фоне помехи с использованием устройства и без него.
Трек 4 - на фоне речевого шума, соотношение сигнал/ шум: ОдБ; Трек 5 - на фоне речевого шума, соотношение сигнал/шум: - 6дБ; трек 10 - на фоне шума ветра, сигнал/шум: ОдБ; трек 11 - на фоне шума ветра, сигнал/шум: - 6дБ; трек 16 - на фоне многоголосия, сигнал/шум: + 6дБ; трек 17 - на фоне многоголосия, сигнал/шум: ОдБ.
Номер трека
Характерист 4 5 10 11 16 17
ика Без С Без С Без С Без С Без С Без С
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.