Исследование и оптимизация линейной оценки прогнозирования при случайных импульсных искажениях в данных тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Шкулев, Александр Анатольевич

  • Шкулев, Александр Анатольевич
  • кандидат технических науккандидат технических наук
  • 2004, Нижний Новгород
  • Специальность ВАК РФ05.13.17
  • Количество страниц 136
Шкулев, Александр Анатольевич. Исследование и оптимизация линейной оценки прогнозирования при случайных импульсных искажениях в данных: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Нижний Новгород. 2004. 136 с.

Оглавление диссертации кандидат технических наук Шкулев, Александр Анатольевич

Введение.

1. Линейная оценка прогнозирования и ее динамические свойства

1.1. Задача линейного прогнозирования. Синтез адаптивного алгоритма.

1.2. Анализ динамических свойств. Теоретико-информационный подход.

1.3. Результаты математического моделирования.

Выводы.

2. Проблема случайных импульсных искажений в данных

2.1. О влиянии случайных импульсных искажений на точность и динамические свойства линейной оценки прогнозирования.

2.2. Синтез оптимального алгоритма.

2.3. Результаты математического моделирования.

Выводы.

3. Обнаружение случайных импульсных искажений.

3.1. Задача обнаружения разладки случайного временного ряда.

3.2. Синтез алгоритма.

3.3. Оптимизация порога обнаружения.

3.4. Результаты математического моделирования.

Выводы.

4. Разработка автоматизированной системы прогнозирования и примеры ее практического применения

4.1. Разработка программного обеспечения.

4.2. Разработка автоматизированной системы прогнозирования.

4.3. Задача прогнозирования динамики рыночной конъюнктуры.

4.4. Задача селекции движущихся радиолокационных целей на фоне комбинированной помехи.

4.5. Задача распознавания речевых сигналов при действии импульсных помех.

4.6. Выводы.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование и оптимизация линейной оценки прогнозирования при случайных импульсных искажениях в данных»

Временной ряд - это расположение во времени статистического показателя, отражающего ход развития изучаемого процесса. Временные ряды исследуются с различными целями. Из них можно выделить две основные цели:

- определение природы ряда;

- прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям).

Обе эти цели требуют, чтобы модель ряда была идентифицирована и, более или менее, формально описана. Как только модель определена, можно с ее помощью интерпретировать рассматриваемые данные (например, использовать в теории для понимания сезонного изменения цен при анализе социально-экономических процессов). Не обращая внимания на глубину понимания и справедливость теории, можно экстраполировать затем ряд на основе найденной модели, т.е. предсказать его будущие значения.

Исходный временной может представляться суммой случайных и детерминированных компонент, или являться коррелированным случайным процессом. Детерминированная (строго определенная) компонента может состоять из циклических компонент и так называемого тренда. Ярким примером циклической компоненты может служить сезонность - зависимость от времени года. Встречаются также циклы другой длительности, обусловленные появлением новых, а значит исчезновением старых товаров, технологий и научных методов. Тренд есть общее направление развития процесса в рассматриваемом периоде времени и чаще всего это результат постоянного воздействия какого-либо важного фактора. Однако тренд может быть всего лишь частью некоторого цикла с периодом большим, чем рассматриваемый временной отрезок.

Случайная составляющая временного ряда возникает в результате воздействия на исследуемый процесс огромного количества благоприятных и неблагоприятных для данного процесса факторов с различными последствиями, сроками действия. Применительно к экономическим процессам, например, к курсовой стоимости акций, можно сказать, что рынок формируется множеством покупателей и продавцов, каждый из которых преследует свои цели, - это может быть и спекулятивная игра, и скупка контрольных пакетов акций, и просто вложение временно свободных средств в надежде на прибыль. Вдобавок, рынок весьма неоднозначно реагирует на разного рода заявления политиков, экономистов, различного рода скандалы и слухи.

Однако не всегда удается добиться достаточного качества обработки временного ряда ввиду возможного наличия в исследуемом периоде данных большого количества непредсказуемых событий (помех), особенно в задаче экономического прогнозирования. К непредсказуемым событиям относятся такие, для предвидения которых в момент составления прогноза нет необходимых данных, или такие, природа которых неопределенна. Таким образом, кроме детерминированных и случайных величин бывают ещё и неопределенные [39]. Между тем, математическая модель может содержать либо детерминированные, либо случайные величины.

Непредсказуемые события могут быть двух видов: приводящие к долговременным изменениям статистических характеристик ряда (ступенчатое изменение) (рис. В. 1.6) и кратковременные случайные импульсные отклонения (импульсные помехи) (рис.ВЛ.а). В первом случае нарушается стационарность случайного процесса и осуществляется скачкообразный переход от одних статистических закономерностей к другим. При этом вся предшествующая выборка оказывается непригодной для последующего использования. Воздействие единичной импульсной помехи (ИП) не приводит к глобальным изменениям статистических характеристик случайного процесса. Однако выборка в данном случае оказывается также непригодной для получения каких-либо приемлемых статистических оценок. В указанном случае могут быть предложены несколько вариантов решения этой проблемы: а)

Рис. B.l - Возможные состояния временного ряда до и после воздействия непредсказуемых событий (случайное импульсное отклонение (а) и ступенчатое изменение (б)).

- отказ от использования выборки до момента воздействия импульсной помехи включительно. В этом случае проблема малых выборок обостряется в значительной степени, т.к. имеющегося объема наблюдений для настройки любой модели может оказаться недостаточно;

- устранение пораженного отсчета из выборки. В этом случае возможно нарушение сезонных циклических составляющих случайного процесса;

- устранение влияния пораженного отсчета путем его восстановления.

Последний вариант является наиболее предпочтительным, т.к. позволяет сохранить целостность выборочных данных.

Кроме рассмотренных социально-экономических процессов, эти проблемы возникают и при анализе процессов в радиосистемах. Обработка информации на фоне помех на протяжении многих лет является одной из актуальных задач радиотехники. Например, решение задачи защиты от стационарных коррелированных помех может осуществляться с использованием процедур декорреляции (обеления) выборочных данных [44] с использованием устройств автокомпенсации [90]. Т.к. в большинстве случаев вероятностные характеристики случайных процессов и помех неизвестны, или они изменяются во времени, то целесообразно использовать адаптивные алгоритмы декорреляции. Во многих случаях они имеют явные преимущества по сравнению с другими методами статистической обработки данных.

В общем виде структура обеляющего фильтра показана на рис. В.2.а. Ключевым звеном обеляющего фильтра является фильтр линейного предсказания (ФЛП). Его решетчатая реализация показана на рис. В.2.6. При анализе блок-схемы решетчатого ФЛП становится очевидной природа негативного влияния импульсных помех на качество обработки входной последовательности х(п). При прохождении импульсной помехи через ФЛП, она воздействует на него, как минимум, в промежуток времени At=M, где М— количество звеньев в фильтре. В этом случае не происходит полного а) б)

Рис. В.2. - Структурная схема обеляющего фильтра (а) и решетчатая реализация фильтра линейного предсказания (б). обеления» случайного процесса х(п), и, следовательно, снижается эффективность подавления комбинированной помехи.

Проблема импульсных помех также актуальна при решении широкого рода задач, а не только задачи прогнозирования временных рядов. Одной из них является задача подавления активных и пассивных помех в системах селекции движущихся целей в PJIC [90]. Любая РЛС подвержена воздействию пассивных помех, представляющих собой отражения от подстилающей поверхности, гидрометеоров (облака, дождь, туман и т.д.) и сосредоточенных местных предметов, как правило, искусственного происхождения (инженерные сооружения, здания, трубы заводов и т.д.). Пассивные помехи в общем случае нестационарны во времени и неоднородны в пространстве, их мощность может намного превышать мощность полезного сигнала.

Также проблема импульсных помех стоит очень остро и в задаче распознавания речевых сигналов. Импульсные искажения здесь возникают в основном в аналоговых и цифровых системах передачи речи и могут иметь различную природу: ненадежная работа системы питания, помехи от системы зажигания в автомобиле и т.п. В этом случае также необходима защита от импульсных помех для обеспечения надежности работы подобных систем.

Однако существует ряд методов, направленных на устранение импульсных помех. Вопросам построения систем, устойчивых к воздействию импульсной помехи, посвящено большое число работ [48, 79 и др.]. Многочисленные алгоритмы можно разделить на три группы [51]. К первой принадлежат способы борьбы, основанные на ограничении сигналов (схемы типа ШОУ, ШОС) или схемы с ключевыми АРУ. Однако, они применимы только к некоторым типам сигналов, приводят к их искажению, существенно уменьшают отношение сигнал/шум.

Ко второй группе принадлежат алгоритмы, основанные на непараметрических методах статистики [48], устойчивые к действию помех. Однако они требуют некоторой обучающей выборки из ансамбля помех, относительно которой формируется решающая статистика. Причем элементы выборки из ансамбля помех должны быть независимыми. Применение таких методов к типичной задаче обнаружения сигнала с неизвестным временным положением на интервале, содержащем много элементов разрешения по задержке на фоне коррелированных шумов, вызывает большие затруднения.

К третьей группе принадлежат адаптивно-компенсационные алгоритмы. Они весьма сложны и работоспособны при очень большом отношении помеха/сигнал, из-за чего резко уменьшаются границы их применения.

Также существует ряд алгоритмов сглаживания импульсных помех. Сглаживание импульсного шума, очевидно, требует обнаружения искаженных элементов сигнала и последующего оценивания их значений по значениям неискаженных элементов. Вообще говоря, алгоритмы сглаживания таких помех должны быть двухпроходовыми с разметкой искаженных элементов на первом проходе и оценкой их сглаженных значений на втором проходе. Но для упрощения можно сделать алгоритм однопроходовым, совместив операции обнаружения и оценивания в одном проходе.

Разметка элементов изображения на искаженные шумом и не искаженные (обнаружение выбросов шума) может быть выполнена на основании проверки гипотезы о принадлежности центрального элемента некоторой локальной окрестности той же выборке, что и заданное большинство остальных элементов окрестности, или выпадения ее из этой выборки. Для решения этой задачи обычно используются алгоритмы, основанные на ранговых статистиках [6]. После этапа обнаружения элементы изображения, отмеченные как выбросы импульсного шума, заменяются их оценкой. В качестве оценки здесь обычно используются значения, полученные тем или иным сглаживанием по окрестности этих элементов, причем из этой окрестности исключаются элементы, отмеченные при обнаружении выбросов шума.

Характерными при сглаживании импульсных помех являются ошибки ложного обнаружения, которые приводят к нежелательному сглаживанию деталей изображения, и ошибки пропуска, из-за которых на изображении могут остаться несглаженные выбросы помех. Это обуславливается применением и низкоэффективных методов обнаружения помех и недостаточно точным их восстановлением, не учитывающим корреляционные свойства случайного процесса. Также надежность этих методов снижается также из-за возможного наличия в окрестности не одного, а нескольких выбросов помех.

Наличие проблемы пораженных и недостоверных данных в выборке при отсутствии эффективных, а тем более универсальных методов их восстановления и обуславливает, в конечном итоге, актуальность данной работы.

Целью работы являются исследование влияния импульсных помех на качество линейной оценки прогнозирования (ЛОП), а также разработка метода защиты ЛОП от интенсивного потока импульсных помех.

Для достижения поставленной цели в диссертационной работе были рассмотрены следующие задачи:

1. Вывод и обоснование критерия качества линейной оценки прогнозирования на основе информационной метрики Кульбака-Лейблера;

2. Анализ влияния случайных импульсных искажений на качество обработки информации при решении задач различного рода с использованием критерия минимума информационного рассогласования (МИР);

3. Разработка цифрового алгоритма восстановления данных, подверженных воздействиям импульсных помех;

4. Разработка цифрового алгоритма обнаружения импульсных помех и исследование его эффективности;

5. Анализ эффективности ЛОП с защитой от ИП в задаче прогнозирования социально-экономических процессов.

6. Анализ эффективности разработанного алгоритма в задачах подавления комбинированных помех в радиотехнических системах и распознавания речевых сигналов методом обеляющего фильтра.

Методы исследования. При решении поставленных задач использовались методы теории вероятностей и математической статистики, теории информации, а также метод математического моделирования в лабораторных и натурных условиях с применением разработанного программного пакета на ПК.

Научная новизна диссертационной работы состоит в следующих полученных результатах:

1. Разработан критерий критерия минимума информационного рассогласования для оценки динамических свойств линейной оценки прогнозирования;

2. Исследована проблема наличия импульсных помех в выборке и подтверждена ее актуальность;

3. Разработан цифровой алгоритм восстановления данных, подверженных воздействиям импульсных помех;

4. Исследовано влияние основных параметров импульсных помех на качество обработки информации;

5. Проведен анализ эффективности разработанного алгоритма с использованием предложенного критерия минимума информационного рассогласования;

6. Обосновано преимущество разработанного алгоритма по сравнению с традиционными алгоритмами борьбы с импульсными помехами.

Практическая ценность работы состоит в разработке и исследовании новых алгоритмов защиты от импульсных помех, а также реализации программного пакета автоматизированной системы обработки данных и прогнозирования «Invest-ХР», предназначенного для решения широкого круга практических задач. Практическая ценность диссертационной работы подтверждается актами об использовании ее результатов в учебном процессе Нижегородского государственного лингвистического университета и Нижегородского государственного технического университета.

Основные результаты диссертационной работы апробированы в докладах на научных конференциях:

- II Всероссийской НТК "Методы и средства измерений физических величин" (Н. Новгород, НГТУ, 1997);

- Всероссийской НТК посвященной 80-летию нижегородской радиолаборатории (Н. Новгород, НГТУ, 1998);

- Всероссийской конференции "Общие проблемы управления и их применение к математической экономике "ОПУ-2000" (Тамбов, ТГУ, 2000);

- V Всероссийской НТК "Методы и средства измерений физических величин" (Н. Новгород, НГТУ, 2000);

- V Всероссийской НТК "Информационные технологии в науке, проектировании и производстве" (Н. Новгород, НГТУ, 2002).

По материалам диссертации опубликовано 10 научных работ, в том числе 4 статьи, кроме того, при участии автора было подготовлено и опубликовано учебное пособие.

Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Шкулев, Александр Анатольевич

Основные результаты диссертационной работы заключаются в следующем:

1. Исследовано влияние импульсных помех на качество линейной оценки прогнозирования. При этом применяется информационный критерий качества. Показано, что по сравнению с известным критерием минимума дисперсии ошибки прогнозирования информационный показатель более точно отражает влияние потока импульсных помех.

2. Предложен алгоритм защиты линейной оценки прогнозирования от импульсных помех. Его основу составляет идея восстановления пораженных отсчетов. Благодаря его применению достигается высокое качество линейной оценки прогнозирования даже при интенсивных потоках импульсных помех.

3. Получено аналитическое выражение для решающей статистики для принятия решения о присутствии или отсутствии импульсных помех в данных в случае анализа процессов типа «авторегрессия».

4. Рассмотрена роль и применение линейной оценки прогнозирования в задачах обработки информации на фоне помех. Показано, что формирование линейной оценки прогнозирования является частью системы оптимальной обработки информации. Благодаря проведенным в диссертации исследованиям существенно расширяются границы области применения адаптивных линейных обеляющих фильтров при действии интенсивных импульсных помех.

5. Создан программный пакет автоматизированной системы обработки информации и прогнозирования на основе предложенного алгоритма защиты от помех.

По результатам диссертационной работы сделаны следующие выводы:

1. Воздействие случайной последовательности импульсных помех в существенной степени ухудшает качество линейной оценки прогнозирования, а также ее динамические свойства. При этом эффективность применения методов с высокими динамическими характеристиками практически сводится к нулю. Особенно сильно влияние помех при небольших объемах выборки, используемой в процессе настройки адаптивного фильтра, что значительно усугубляет и без того остро стоящую проблему малых выборок.

2. Синтезированный алгоритм восстановления искаженных выборочных данных позволяет практически полностью устранить негативное влияние действия импульсных помех на качество обработки сигнала, в частности, прогнозирования случайных процессов. При этом удается значительно снизить информационное рассогласование используемой модели и исследуемой выборки данных.

3. Доказана высокая надежность обнаружителя импульсных помех, разработанного на основе метода обнаружения разладки в частотной области. При этом эффективность восстановления, при увеличении интенсивности импульсных помех по частоте своего повторения, снижается незначительно. Также показано, что эффективность работы любого обнаружителя возрастает при увеличении мощности импульсных искажений.

4. Приведенные примеры практического использования процедуры оптимизации линейной оценки прогнозирования при наличии импульсных искажений в выборочных данных позволяют говорить о высокой степени актуальности поставленной в работе задачи оптимизации прогноза, особенно при существенных ограничениях объема используемых данных. В целом ряде случаев это приводит к серьезному повышению эффективности прогнозирования динамики социально-экономических процессов.

5. Предлагаемый метод восстановления выборочных данных может быть успешно применен в широком кругу таких практических задач, как, например, распознавание речевых сигналов и подавление комбинированных помех в системах селекции движущихся целей. Т.к. решение этих задач основано на идее использования обеляющих фильтров, то, следовательно, для анализа качества обработки информации целесообразно использовать критерий минимума информационного рассогласования.

Сфера применения полученных результатов довольно обширна. К числу наиболее перспективных задач в данном направлении наряду с рассмотренными следует отнести те, в которых любое воздействие импульсных помех приводит к существенному снижению качества обработки информации. При этом рекомендуется использовать предлагаемую систему защиты от воздействия помех на любом этапе обработки, особенно на этапе подготовки (корректировки) данных.

Заключение

Список литературы диссертационного исследования кандидат технических наук Шкулев, Александр Анатольевич, 2004 год

1. Адаптивные фильтры/ Под. ред. К.Ф. Коуэна, П.М. Гранта: Пер. с англ. -М.: Мир, 1988.-388 с.

2. Акатьев Д.Ю., Бочаров И.В. Распознавание речевых сигналов на основе метода обеляющего фильтра. // Электронный журнал "Исследовано в России", 148, стр. 1801-1809. МФТИ-2003.

3. Акатьев Д.Ю., Грушин В.А., Шкулев А.А. Моделирование разладки случайного процесса в частотной области // Методы и средства измерений физических величин: тез. докл. II всерос. НТК. — Н.Новгород.: НГТУ, 1997. -С. 80.

4. Андерсен Т. Введение в многомерный статистический анализ. М.: Физматгиз, 1963. - 500 с.

5. Андерсен Т. Статистический анализ временных рядов. М.: Мир, 1976. -756 с.

6. Беликова Т.П., Ярославский Л.П. Использование адаптивных амплитудных преобразований для препарирования изображений // Вопросы радиоэлектроники. Сер. Общетехн. 1974. - Вып. 14.

7. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир, 1989.-540 с.

8. Берг Дж. П., Люндбергер Д.Г., Венгер Д.Л. Оценивание ковариационных матриц с заданной структурой// ТИИЭР. 1982. т. 70. - №9. - С. 63-76.

9. Боровков А.А. Математическая статистика — М.: Наука, 1984.

10. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 1974. Вып. 1 288 е.; Вып. 2 - 254 с.

11. Бочаров И.В., Акатьев Д.Ю. Распознавание речевых сигналов на основе корреляционного метода. // Электронный журнал "Исследовано в России", 131/030730, С. 1547-1557. МФТИ-2003.

12. Бриллинджер Д. Временные ряды. М.: Мир, 1980. - 536 с.

13. Векслер Л.С. Статистический анализ на персональном компьютере// МИР1. ПК, №2, 1992, с. 89-97.

14. Вентцель Е.С. Теория вероятностей. М.: Наука, 1973.

15. Габитова А.Р. Нейронные сети как метод прогнозирования экономических показателей// Математическое моделирование экономических систем и процессов: тез. докл. всеросс. НПК. Чебоксары.: ЧТУ, 2000, - С. 44-45.

16. Галушкин А.И., Шмид А.И. Оптимизация структуры многослойных нейронных сетей с перекрестными связями // Нейрокомпьютер, 1992, №2. С. 7-11.

17. Гельфонд А.О. Исчисление конечных разностей. 3-е изд. М.: Наука, 1967.

18. Геминтерн В.И., Френкель А.А. Обобщенные модели авторегрессии и скользящего среднего в анализе временных рядов В кн.: Статистический анализ экономических временных рядов и прогнозирование. М.: Наука, 1973.

19. Герасимова А.В., Грачев JI.B. К вопросу о представлении обучающей выборки для парадигмы нейронных сетей с переменной структурой// Нейрокомпьютер, 1992, №3/4. С. 3-6.

20. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М.: Мир, 1985.

21. Горбань А.С., Россиев Д.Н. Нейронные сети на персональном компьютере — Новосибирск: Наука, 1996.

22. Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике. М.: Статистика, 1972.

23. Д.-Э. Бэстенс, В.М. Ван Ден Берг, Д. Вуд Нейронные сети и финансовые рынки М.: ТВП "Научное издательство", 1997. - 236 с.

24. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. М.: Мир. Вып. 1, 1971.-316 е.; Вып. 2, 1972.-288 с.

25. Кендэл М. Временные ряды. М.: Финансы и статистика, 1981. - 199 с.

26. Кендэл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. - 736 с.

27. Кендэл М., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973. - 899 с.

28. Кендэл М., Стьюарт А. Теория распределений. М.: Наука, 1966.

29. Кильдишев Г.С., Френкель А.А. Анализ временных рядов и прогнозирование. М.: Статистика, 1973.

30. Клигенэ Н., Телькснис Л. Методы обнаружения моментов изменения свойств случайных процессов // Автоматика и телемеханика. 1983. № 10.

31. Козловских А.В., Ситников О.В., Шипачев В.И. Описание динамики курсов акций системой нелинейных дифференциальных уравнений// Математическое моделирование экономических систем и процессов: тез. докл. всеросс. НПК. Чебоксары.: ЧТУ, 2000, - С. 74-75.

32. Кузнецов С.Е., Халилеев А.А. Обзор специализированных статистических пакетов по анализу временных рядов: научный отчет М.: Центр "СтатДиалог", 1993.

33. Кузнецова К.С. Голодненко В.Н. К вопросу о количественной оценке точности прогноза// Экономика и математические методы. 1971. т. 7, вып. 6. С. 843-849.

34. Кулаичев А.П. Пакеты для анализа данных// МИР ПК, №1, 1995.

35. Кульбак С. Теория информации и статистика: Пер. с англ./ Под ред. А.Н. Колмогорова. М.: Наука, 1967. - 408 с.

36. Левин Б.Р. Статистическая радиотехника М: Радио и связь, 1967

37. Леман Э. Проверка статистических гипотез. М.: Наука, 1964

38. Лукацкая М.Л. Статистические методы анализа динамических рядов в экономике: Автореф. дисс. на соискание учен, степени к.э.н. (Новосиб. гос. университет). Новосибирск, 1967.

39. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. М.: Финансы и статистика, 2003. - 416 с.

40. Лукашин Ю.П. Анализ временных рядов по методу авторегрессии-скользящей средней. Статистические методы анализа (алгоритмы и программы). М.: ИМЭМО АН СССР, 1975, вып 5.

41. Лэнинг Дж. X., Бэттин Р.Г. Случайные процессы в задачах автоматического управления. М.: ИЛ, 1958.42.45,4649

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.