Минимаксная рекуррентная интерполяция динамических объектов тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат физико-математических наук Штаненко, Татьяна Ивановна

  • Штаненко, Татьяна Ивановна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2000, Санкт-Петербург
  • Специальность ВАК РФ01.01.09
  • Количество страниц 108
Штаненко, Татьяна Ивановна. Минимаксная рекуррентная интерполяция динамических объектов: дис. кандидат физико-математических наук: 01.01.09 - Дискретная математика и математическая кибернетика. Санкт-Петербург. 2000. 108 с.

Оглавление диссертации кандидат физико-математических наук Штаненко, Татьяна Ивановна

Введение

1 Рекуррентные формы представления оптимального фильтра

1.1. Линейная фильтрация

1.1.1. Постановка задачи

1.1.2. Погрешность фильтрации как функция помехи.

1.2. Матричная линейно-квадратичная задача оптимизации.

1.2.1. Постановка задачи

1.2.2. Сведение матричной линейно-квадратичной задачи оптимизации к задаче оптимального управления.

1.2.3. Решение линейно-квадратичной задачи оптимального управления

1.2.4. Разрешимость матричной линейно-квадратичной задачи и некоторые свойства ее решений

1.3. Рекуррентные оптимальные фильтры.

1.3.1. Оптимальный прогнозирующий фильтр

1.3.2. Оптимальный одношаговый прогноз

1.3.3. Оптимальный сглаживающий фильтр

1.3.4. Оптимальное одношаговое сглаживание.

1.4. Рекуррентные фильтры в стационарном случае.

1.4.1. Оптимальный прогноз.

1.4.2. Оптимальное сглаживание.

1.4.3. Собственно фильтрация

1.4.4. Упрощенное вычисление калмановского коэффициента.

1.4.5. Пример: скалярный формирующий фильтр.

1.5. Минимаксная фильтрация.

1.5.1. Общие понятия теории минимаксной фильтрации

1.5.2. Решение стандартной минимаксной задачи

1.5.3. Рекуррентная минимаксная фильтрация.

2 Решение задачи оптимального сглаживания в дискретном времени

2.1. Постановка задачи.

2.2. Сведение к оптимизации по коэффициентам при упреждающих измерениях

2.3. Вычисление оптимальных коэффициентов и матрицы ковариаций

2.4. Рекуррентные формулы для оптимальных сглаживающих оценок

2.5. Факторизация матрицы приращения ковариаций.

2.6. Зависимость качества фильтрации от запаздывания.

2.7. Вычисление абсолютно минимальной матрицы ковариаций.

2.8. Явная формула для оптимальной весовой функции

3 Оптимальная интерполяция в непрерывном времени

3.1. Постановка задачи.

3.2. Разделение оптимальной оценки на прошлое и будущее.

3.3. Расчет весовой функции

4 Решение задачи Н°°-оптимального сглаживания

4.1. Постановка задачи 7^°°-оптимального сглаживания.

4.2. Двойственная задача управления.

4.3. Решение задач управления и фильтрации при помощи линейного функционального уравнения.

4.4. И00-оптимальное интерполирование

4.5. Примеры.

Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Минимаксная рекуррентная интерполяция динамических объектов»

В стандартной линейно-квадратичной теории оптимальной фильтрации ставятся три задачи: сглаживание или интерполяция; собственно фильтрация; прогноз или экстраполяция. Они различаются объемом измерений, которые доступны в момент времени когда требуется оценить состояние системы х(1).

Решение задач собственно фильтрации и прогноза дается известным фильтром Калмана-Бьюси, описанным в большом количестве монографий [1, 9, 18, 19, 20]. Популярность этих задач связана, с одной стороны, с прикладной значимостью оценок текущих фазовых векторов и их будущих значений по последним измерениям, а с другой стороны, — с эффективностью вычислительных процедур решения, которые сводятся к рекуррентному фильтру Калмана-Бьюси.

Линейно-квадратичная задача интерполяции исследована значительно меньше. Ее решение может быть представлено в разных видах, в зависимости от соотношения между объемом оцениваемых величин и объемом доступной к моменту оценивания информации. Так, по фиксированному объему измерений можно построить оценки всех фазовых векторов системы на промежутке наблюдения. В данной работе изучается, в основном, другая постановка задачи: имеется фиксированное запаздывание оцениваемого вектора по отношению к последнему доступному измерению, и требуется минимизировать квадратичный функционал качества относительно ошибки оценивания. Функционал может быть либо дисперсией ошибки оценивания либо минимаксным по множеству возмущений относительно этой ошибки, что приводит к линейно-квадратичным постановкам и к 7^°°-оптимизации.

В стандартной постановке общей линейно-квадратичной стохастической задачи оптимальной фильтрации в непрерывном времени объект наблюдения и измеритель описываются уравнениями Ито где ги(-) — стандартный векторный винеровский процесс, описывающий возмущения в объекте и измерителе, ж(£) — фазовый вектор системы, у(£) — наблюдаемая векторная величина, А(Ь), В(¿), -0(0 — матрицы соответствующих размерностей. Начальные данные не зависят от будущих значений возмущений и являются случайными величинами — хо, о) = Уо с заданными первыми и вторыми моментами.

При фиксированном числе г требуется по наблюдениям до момента I + т найти линейную оценку rt+r x(t\t + r) = h(t,s)dy(s), J to которая минимизирует функционал

J (h) = E\x(t) - x(t\t + т) I2.

Обозначим оптимальную оценку x(t\t + г), она определяется матричной весовой функцией h(t,s). В прикладных задачах большое значение имеет вычислительная сложность расчета этой оценки, поэтому вместо явного представления величины x(t\t + r) через приращения у (s) желательно найти рекуррентную форму, в которой приращения оценки определяются лишь несколькими ранее вычисленными величинами и приращениями нового измерения y(t + т).

Если т = 0, то задача называется собственно фильтрации, и ее решение дается знаменитым фильтром Калмана-Бьюси. Пусть возмущения в объекте и измерителе независимы, т. е. D{t)B(t)T = 0, а матрица R(t) = D(t)D(t)T невырождена. Тогда оптимальные оценки собственно фильтрации могут быть рассчитаны при помощи следующего стохастического уравнения: dx(t\t) = A(t)x(t\t)dt +K(t)(dy(t)-C(t)x(t\t)dt),

P(t\t) = A(t)P(t\t) + P(t\t)A(t)T + B{t)B{t)T - P{t\t)C{t)TR{t)~lC{t)P{t\t), K(t) = P(f|i)C(i)Tfl(i)-1 с начальным данным x(to\to) = Ex0, P(t0\t0) = cov(x(tQ)). Здесь P(t\t) — матрица ковариаций ошибки оценивания e{t\t) = x(t) — x(t\t), K(t) — коэффициент усиления Калмана. Уравнение устойчиво, если пара функций (A(t),C(t)) детектируема, что в дальнейшем предполагается.

При т < 0 получается задача прогноза или экстраполяции. Ее решение сводится к собственно фильтрации. Оптимальный фильтр состоит из фильтра Калмана-Бьюси и дополнительного уравнения dx(t + ф) = A(s)x(t + ф), t + r<s<t.

При г > 0 возникает задача интерполяции или сглаживания, в которой требуется оценить вектор x(t) по всем прошлым измерениям у (s), s < t и отрезку будущих измерений у (s), t < s < t + т. Именно этой задаче посвящена данная диссертационная работа.

Одним из основных справочников по линейно-квадратичной теории оптимальной фильтрации считается монография А. Язвинского [32], изданная в 1970 г. В ней сформулированы решения основных задач фильтрации и сопутствующих проблем уравнений Риккати, причем изложение ведется с единых позиций, в основе которых лежат свойства некоррелированности обновляющего процесса de(t) = dy(t) — C{t)x{t\t) dt. Аналогичные решения в дальнейшем публиковались и в других зарубежных [12] и отечественных монографиях [15, 13].

В поставленной задаче оптимальной интерполяции предлагается вычислять оптимальные оценки в соответствии со следующим утверждением, которое цитирует соответствующую опубликованную теорему в части, касающейся уравнения для x(t\t + r).

Теорема 0.1. [32, 15]. Оптимальная несмещенная оценка x{t\t + т) является решением стохастического дифференциального уравнения dx(t\t + т) = A(t)x(t\t + r)dt + S(t + r)K(t + T)(clij(t + т) - C(t)x(t + r\t + r) dt) + +F(t)(x(t\t + T)-x(t\t))dt, t>t0, где F(t) = B(t)B{t)TPit^)"1 и матрица S(t) удовлетворяет дифференциальному уравнению s (i + т) = [Ait) + F(t)}S{t + r) - S(t + r)[A(t + r) + F(t + r)].

В соответствии с этой теоремой оптимальная оценка x(t\t + г) вычисляется как решение стохастического линейного дифференциального уравнения. Этот рекуррентный способ расчета оценки не включает явного интегрирования в каждый момент времени í, и сложность его реализации лишь немного уступает стандартному фильтру Калмана-Бьюси.

Однако, на самом деле этот фильтр неработоспособен и не может применяться для практических вычислений, так как он неустойчив. Докажем это, для простоты, на примере стационарной системы.

Лемма 0.1. Пусть матрицы Ait) = A, Bit) = В, C{t) = С, Dit) = D не зависят от времени, а начальная ковариация P(tQ\to) = Р является решением уравнения Лурье

АР + РАТ + ВВТ - PCTR~1CP = 0.

Пусть пара матриц (А, В) управляема, а пара (А, С) наблюдаема.

Тогда фильтр, сформулированный в теореме 0.1, полностью неустойчив, т. е. его матрица имеет все собственные числа в правой полуплоскости.

Доказательство. Величины x{t\t) и x(t + r\t + т) определяются стандартным фильтром Калмана-Бьюси, в который не входят оценки x(t\t + г). Поэтому в дифференциальном уравнении из теоремы 0.1 они являются внешними входными данными. Общее решение этого дифференциального уравнения определяется его матрицей А = А + ВВТР~1. Докажем, что она антигурвицева.

Пусть К = PCTRrl — коэффициент усиления фильтра Калмана-Бьюси. Уравнение Лурье можно записать в виде

А - КС = -Р(АТ + Р-1ВВТ)Р~1.

Матрица А — КС, являясь матрицей линейной части фильтра Калмана-Бьюси, гур-вицева, что также видно из уравнения Ляпунова

А - КС)Р + Р(А - КС)Т = -ВВТ - PCR~1CP, правая часть которого неположительна, а решение Р > 0.

Следовательно, матрица Ат + Р~1ВВТ — Ат антигурвицева, и ее собственные числа совпадают с собственными числами матрицы линейной части дифференциального уравнения из утверждения теоремы 0.1, что и требовалось доказать. □

Аналогичный неустойчивый фильтр в линейно-квадратичной задаче интерполяции для систем в дискретном времени представлен в [12, 13]. Эти уравнения могут представлять некоторый теоретический интерес, но непригодны для проведения расчетов в приложениях.

В широко известной монографии Р.Ш. Липцера и А.Н. Ширяева [11] также приведены решения всех основных задач оптимальной фильтрации, прогноза и сглаживания как для линейных стохастических гауссовских систем, так и для их прямых обобщений — условно-гауссовских процессов.

Оптимальную оценку в задаче интерполяции предлагается вычислять в виде хШ + г) = хШ) + [ h(t,t + и) (dy(t + и) - C(t + u)x(t + u\t + и) du).

Jo

Это устойчивое уравнение, которое можно назвать полурекуррентным, так как оценка x(t\t) определяется рекуррентно, а дополнительное слагаемое предполагает явное интегрирование по промежутку 0 < и < т.

Для нестационарных систем данное решение можно считать окончательным. Для стационарных систем наблюдения, которые имеют большую практическую область приложения и в которых матрицы А, В, С, D постоянны, а матрица P(t\t) зависит от времени, желательно представить интеграл в таком виде, чтобы его весовые функции не менялись с течением времени и не требовали постоянного пересчета.

Кроме того, в системах с постоянными матрицами уравнений объекта и измерителя практически важно знать зависимость точности оптимальных оценок от величины запаздывания г. Баланс между желаниями разработчика фильтра улучшить его точность за счет увеличения т и уменьшить вычислительные затраты за счет уменьшения т проще всего устанавливается, если имеется явная зависимость оптимальной точности от т. Все эти задачи рассматриваются во главе 2 диссертационной работы для систем в дискретном времени и в главе 3 для систем в непрерывном времени.

В главе 1 изучается задача оптимальной интерполяции для нестационарных систем в дискретном времени. Для задачи собственно фильтрации известны алгебраические преобразования двойственности, сводящие ее к стандартной задаче аналитического конструирования регуляторов для систем без возмущений [21]. В данной работе представлены аналогичные преобразования, сводящие задачу интерполяции к расширенной задаче аналитического конструирования регуляторов, которая решается в два этапа. На этом пути вычисляются коэффициенты нерекуррентного уравнения оптимального фильтра. Затем показано, что эти коэффициенты связаны рекуррентным уравнением и порождают полурекуррентный фильтр, пригодный для вычисления оптимальной интерполирующей оценки.

Стандартная стохастическая линейно-квадратичная задача оптимальной фильтрации предполагает минимизацию дисперсии ошибки оценивания и не является минимаксной. В главе 1 сформулирована детерминированная минимаксная задача оптимальной фильтрации, решение которой в точности совпадает с решением стандартной стохастической задачи. Поэтому рассмотренные в главах 1-3 линейно-квадратичные задачи фильтрации решают двойственные им минимаксные задачи, а полученные результаты являются вкладом в теорию минимаксной интерполяции динамических объектов.

В главе 4 изучается задача "Н°°-оптимальной интерполяции для систем в непрерывном времени. Теория "Н°°-оптимального управления и оценивания началась, по-видимому, с работ Г. Зеймса [38] и бурно развивалась в последние 15 лет. Можно отметить спектральную теорию, изложенную в монографии Б. Френсиса [31] и давшую первые решения простейших задач -оптимального управления, метод пространства состояний или метод двух уравнений Риккати [30], полиномиальный подход X. Квакернаака [35] и многие другие работы, доложенные на специальных секциях крупнейших международных конференций по теории управления.

Явные решения и численные алгоритмы были получены в основном для систем с матричными рациональными передаточными функциями. Это связано, в частности, с большой популярностью метода уравнений Риккати. Для систем с запаздыванием вектор состояний становится бесконечномерным, а уравнение Риккати из матричного преобразуется в операторное. Решение последнего уравнения представляет значительную вычислительную трудность. Лишь в последние годы в работах ряда авторов появляются алгоритмы расчета регуляторов и фильтров в простейших системах с запаздыванием [36]. В задаче оптимальной интерполяции отметим успешную попытку решения операторного уравнения Риккати, представленную в докладе [34].

В конце 90-х годов был разработан новый метод синтеза "Н^-оптимальных регуляторов, основанный на решении одного линейного функционального уравнения и названный также Ф-подходом [26, 27, 28]. Он позволяет непосредственно вычислять параметры оптимальных и субоптимальных регуляторов без обращения к многочисленным вспомогательным процедурам параметризации, матричным уравнениям и другим преобразованиям. В главе 4 этот метод распространен на непрерывные системы с запаздыванием по возмущению. Кроме того, в главе 4 представлена теорема двойственности задач -оптимального управления и фильтрации для систем в терминах вход-выход. По этой двойственности задачи оптимальной интерполяции в непрерывном времени сводятся к соответствующим задачам управления, которые решаются методом линейного функционального уравнения.

Сформулирован численный алгоритм расчета параметров И00-оптимального фильтра для систем со скалярными входом и выходом. Приведены решения в двух частных случаях: для объектов первого и второго порядков. Объект второго порядка может моделировать волновое возмущение, а его интерполяция может быть применена в задачах подавления возмущений на радарном изображении морской поверхности.

Диссертация состоит из четырех глав, введения, заключения и списка литературы.

Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Заключение диссертации по теме «Дискретная математика и математическая кибернетика», Штаненко, Татьяна Ивановна

Заключение

В данной работе приведены решения задач оптимальной фильтрации линейного объекта наблюдения в дискретном и непрерывном времени с показателями качества, свойственными линейно-квадратичной теории и И00-оптимизации.

На защиту выносятся следующие результаты:

1. Преобразование двойственности линейно-квадратичных задач управления и фильтрации в дискретном времени на конечном промежутке путем сведения к матричной задачи оптимизации (п. 1.1 и 1.2).

2. Решение двойственных задач оптимальной интерполяции и аналитического синтеза регуляторов с расширенным набором управлений (теоремы 1.1 и 1.2).

3. Расчет параметров рекуррентных фильтров в задачах интерполяции и прогноза в дискретном времени для нестационарных объектов (теоремы 1.3 и 1.4).

4. Общая формулировка задачи минимаксной фильтрации с терминальным функционалом качества и ее сведение к линейно-квадратичной стохастической задаче (лемма 1.5, теорема 1.5).

5. Выделение стационарного и рекуррентного фильтров в оптимальном интерполяторе (теорема 2.1).

6. Рекуррентный расчет зависимости оптимальной матрицы ковариаций ошибки интерполирования от величины запаздывания (теорема 2.2).

7. Расчет предельной матрицы ковариаций по всем измерениям спектральным методом (теорема 2.3).

8. Явная формула для стационарной и нестационарной частей оптимального интерполятора в дискретном времени (теорема 2.4).

9. Явная формула для стационарной и нестационарной частей оптимального интерполятора в непрерывном времени (теорема 3.1 и следствия из нее).

10. Преобразование двойственности в задачах "Н^-оптимальной интерполяции и управления с запаздыванием (теорема 4.1, следствие 4.1).

11. Алгоритм расчета И00-оптимального фильтра в задаче интерполяции для систем со скалярными входами и выходами (п. 4.4).

12. Примеры расчетов 'Н°°-оптимальных фильтров и соответствующих систем управления для объектов первого и второго порядков (п. 4.5).

Список литературы диссертационного исследования кандидат физико-математических наук Штаненко, Татьяна Ивановна, 2000 год

1. М. Аоки. Оптимизация стохастических систем. М., 1971, 424 с.

2. А.Е. Барабанов, A.A. Первозванский. Оптимизация по равномерно-частотным показателям (Н-теория). Автоматика и телемеханика. 1992. № 9, с. 3-32.

3. А.Е. Барабанов, Т.Н. Штаненко. % 00-оптимальное управление и фильтрация при упреждающих наблюдениях. Воронежская весенняя математическая школа "Понтрягинские чтения-XI". Воронеж, 3-9 мая 2000, с. 14.

4. А.Е. Барабанов, Т.Н. Штаненко. Минимаксная интерполяция волновых процессов по зашумленным наблюдениям. Международная конференция DSO'2000. Екатеринбург, 30 мая 2 июня 2000, с. 57.

5. P.E. Калман, P.C. Бьюси. Новые результаты в линейной фильтрации и теории предсказания. Техническая механика, 1961, т. 83, сер. Д, № 1, с. 123-141.

6. X. Квакернаак, Р. Сиван. Линейные оптимальные системы управления. М.: 1977.

7. A.II. Колмогоров. Интерполирование и экстраполирование стационарных случайных последовательностей. Изв. АН СССР. Математика. 1941, № 5, с. 3-14.

8. Фильтрация и стохастическое управление в динамических системах. Под. ред. К/Г. Леондеса. М., 1980, 407 с.

9. A.M. JTemoe. Аналитическое конструирование регуляторов. Автоматика и телемеханика, 1960, № 6, с. 5-14.

10. Р.Ш. Липцер, A.FI. Ширяев. Статистика случайных процессов. М., 1974, 696 с.

11. Док.С. Медич. Статистически оптимальные линейные оценки и управление. М.: Энергия, 1973.

12. М.А. Огарков. Методы статистического оценивания параметров случайных процессов. М., 1980, 208 с.

13. O.A. Петров, B.H. Фомин. Линейная фильтрация случайных процессов. Л.: Изд-во Ленингр. ун-та, 1991.15 161718 1920

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.