Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат физико-математических наук Румянцев, Дмитрий Станиславович
- Специальность ВАК РФ05.13.01
- Количество страниц 139
Оглавление диссертации кандидат физико-математических наук Румянцев, Дмитрий Станиславович
Список основных обозначений
Введение
1 Оптимизация стохастических систем с информационными ограничениями
1.1 Постановка задачи оптимального управления стохастическими системами диффузионного типа при наличии информационных ограничений.
1.2 Достаточные условия оптимальности
1.3 Локальные условия оптимальности первого порядка.
1.4 Техническое описание системы управления.
1.5 Выводы.
2 Оптимизация квазилинейных стохастических систем
2.1 Постановка задачи.
2.2 Условия оптимальности.
2.3 Оптимизация квазилинейных стохастических систем при наличии случайных погрешностей вектора состояния и реализации управления.
2.4 Обобщение на случай стохастических возмущений матриц коэффициентов линейной системы.
2.5 Выводы.
3 Численные методы синтеза стратегий оптимального управления стохастическими системами с информационными ограничениями
3.1 Численные методы поиска.
3.2 Управление скоростью сходимости.
3.3 Теоремы об улучшении критерия.
3.4 Квазилинейные задачи с квадратичным критерием.
3.4.1 Способы решения уравнения (2.23).
3.4.2 Алгоритмы численных методов оптимизации стратегии управления.
3.5 Примеры
3.6 Выводы.
4 Программное обеспечение для расчёта оптимального управления квазилинейными стохастическими системами
4.1 Общие сведения о программе.
4.2 Диалоговый интерфейс.
4.3 Выводы.
5 Примеры задач оптимального управления летательными аппаратами
5.1 Задача демпфирования колебаний спутника Земли с гравитационной стабилизацией.
5.2 Задача о стабилизации орбиты искусственного спутника 3емли
5.3 Выводы.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению2017 год, кандидат наук Царьков, Кирилл Александрович
Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии2016 год, кандидат наук Халина, Анастасия Сергеевна
Оптимизация управления стохастических систем с запаздыванием2011 год, кандидат физико-математических наук Аюкасов, Рустам Анатольевич
Математическое моделирование и оптимальная стабилизация в классе квазилинейных стохастических систем с управляемыми параметрами2019 год, кандидат наук Онегин Евгений Евгеньевич
Игровые методы оптимизации вероятностных функционалов и их применение к решению аэрокосмических и экономических задач2001 год, доктор физико-математических наук Кан, Юрий Сергеевич
Введение диссертации (часть автореферата) на тему «Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями»
Диссертационная работа посвящена разработке методов оптимального управления стохастическими системами диффузионного типа в задачах с информационными ограничениями.
Актуальность исследований в этом направлении обуславливается необходимостью наиболее точного описания систем автоматического управления, реалистичным вариантом которого является стохастическое описание, учитывающее воздействие па объект управления случайных факторов, в предположении неполноты информации о состоянии. Предложенные в диссертации условия оптимальности для квазилинейных систем вносят существенный вклад в развитие этого направления теории оптимальных процессов, в частности, позволяют решать задачи управления линейными системами с мультипликативными возмущениями управления и со случайными возмущениями в матрицах уравнений системы.
Целью диссертационной работы является разработка методов синтеза оптимальных стратегий управления стохастическими квазилинейными системами в случае измерения части компонент вектора состояния при наличии ошибок измерения и ошибок реализации управления.
В соответствии с целью исследования были поставлены следующие задачи:
1. получить конструктивные условия оптимальности в задачах синтеза стратегий оптимального управления:
- квазилинейными стохастическими системами при измерении части компонент вектора состояния;
- линейными стохастическими системами со случайными возмущениями в матрицах системы при измерении части компонент вектора состояния;
- квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления;
2. разработать численные методы решения задач п.1;
3. создать программное обеспечение для реализации численных методов;
4. провести решение тестовых прикладных задач при различном уровне информированности с применением предложенных теоретических результатов.
Для решения поставленных задач использовался метод функций Ляпунова-Лагранжа, наметившийся еще в ранних работах Хрусталёва М.М. при изучении проблемы оптимального управления частично наблюдаемым диффузионным процессом и получивший дальнейшее развитие в его работах по стохастическим дифференциальным играм с неполной информацией [1, 2]. Этот подход состоит в использовании совокупности функций, аналогичных вектор-функциям Ляпунова в теории устойчивости. Но в изучаемом круге проблем эти функции играют двоякую роль. С одной стороны, их применение так же, как функций Ляпунова, подменяет проблему изучения поведения траекторий динамической системы изучением поведения этих функций вдоль траекторий системы. С другой - они являются нелинейными нелокальными аналогами классических множителей Лагранжа, предназначенными для полного снятия ограничений. В связи с такой двойной ролью эти функции были названы вектор-функциями Ляпунова-Лагранжа [1, 2].
Важным результатом применения векторных функций Ляпунова-Лагранжа является снятие всех нелокальных ограничений, в том числе и информационных, доведение условий оптимальности до совокупности уравнений (или неравенств) для этих функций и семейства конечномерных экстремальных задач, решаемых в фиксированный момент времени локально в каждой точке пространства состояний, аналогично тому, как это делается в условиях принципа максимума Понтрягина Л.С. или динамического программирования для классической задачи оптимального управления.
Фундаментом для метода Ляпунова-Лагранжа послужили работы Понтрягина Л.С. [3], Беллмана Р. [4], Кротова В.Ф. [5], Гурмана В.И. [6], в которых встречались те или иные фрагменты метода. Различные аспекты метода исследовались в [7]-[11] и более поздних работах [12]. Близкий методу функций Ляпунова-Лагранжа подход предлагается в [13].
Для описания динамической системы составляется ее математическая модель. Одно из основных требований, предъявляемых к модели, -наиболее точно описать функционирующий технический объект, для которого в реальной ситуации зачастую невозможно получать полную информацию о динамике системы, возмущениях, действующих на него и т.д. В результате возникает задача оптимизации с информационными ограничениями. Традиционно уделяется большое внимание методам решеиия задач оптимизации динамических систем, позволяющим определять непрерывное управление либо как функцию от начальных условий и времени (программное управление) [3], либо как функцию времени и текущих фазовых координат системы (синтез управления) [4]. Как уже отмечено, на практике существует обширный класс динамических систем, в которых информация о положении в фазовом пространстве является неполной и ограничена измерительным устройством, которым располагает система. Возможности управления такими системами существенно зависят от той информации, которая может быть получена путем измерения и обработки наблюдений. Поэтому в теории стали развиваться направления, связанные с решением задач оптимизации динамических систем в условиях неопределенности, например: управление пучками траекторий [14]-[27]; управление стохастическими системами [28]-[55]; управление системами с распределёнными параметрами, в том числе, с неполной информацией [56]-[64]; децентрализованное управление [65]-[72]; управление в антагонистических и коалиционных играх [73]-[78]; управление дискретными системами [6],[79]-[91] и т.д.
Проведем обзор известных методов оптимизации систем управления с точки зрения доступности информации об объекте. Вместе с методами управления стохастическими системами диффузионного типа будем также рассматривать методы управления: детерминированными системами, так как в определённой мере они являются частными случаями стохастических систем; системами с распределёнными параметрами, поскольку часто управление стохастическими системами сводится к детерминированной задаче управления решением уравнений в частных производных.
При наличии неопределенности в динамической системе есть три пути решения задачи синтеза стратегии управления.
В первом случае отыскивается управление, являющееся функцией наблюдаемых переменных. В этом случае находится структура стратегии управления, которая непосредственно зависит от наблюдаемого сигнала.
Второй путь связан с нахождением оптимального закона управления, который использует оценку состояния динамической системы. Эта оценка делается на основе имеющейся информации путём дополнительного построения фильтров (идентификаторов состояния). Именно она используется при построении управления в работах [93]-[105].
Третий путь является комбинаций первого и второго. В этом случае решается задача совместного отыскания оптимальной стратегии управления и оптимального фильтра, задающего оценку состояния динамической системы.
В данной работе принята постановка задачи, соответствующая первому пути.
Пусть для некоторой математической модели динамической системы с состоянием х G Rn, управлением и 6 Rm, временем t Е R1 требуется синтезировать стратегию управления и = u(t: ж), удовлетворящую цели управления. При этом известно, что наблюдается лишь часть компонент вектора х.
Для задач стохастического оптимального управления традиционным является поиск минимума математического ожидания функционала [15]. Однако, иногда рассматриваются и другие критерии [106, 107, 108]. Проблеме существования управления с неполной обратной связью посвящены работы [31]-[36]. Различные методы управления стохастическими системами с неполным вектором наблюдения описаны в работах [37]-[46]. Следует выделить работы У. Флеминга [45] и В.В. Семёнова [46], в которых получены необходимые условия оптимальности для стохастических систем с неполной обратной связью общего вида. Характерным в этих подходах является то, что исходная стохастическая задача сводится к детерминированной задаче управления решениями уравнения в частных производных. Эти работы нашли свое развитие в статьях А.В. Пантелеева, А.С. Бортаковского, Е.А. Руденко [17], [18], [50]-[54], [84]-[87], в которых сформулировано несколько вариантов достаточных условий оптимальности.
Вопросам оптимального управления системами с распределёнными параметрами при неполном измерении состояния посвящены работы из обзора [59].
Этот же вариант информированности имеет сходство с задачами построения фильтров в смысле их постановок. Поэтому приведём здесь ещё несколько замечаний, связанных с теорией фильтрации, основу которой, несомненно, заложили Калман и Бьюси [92]. Здесь можно выделить два направления. В подходе Р.Л. Стратоновича [93] основные проблемы, возникающие из стремления повысить точность оценивания, связаны с наличием большой размерности строящихся фильтров. В [94] B.C. Пугачёв обходит эти трудности путем фиксации структуры искомого фильтра и сосредоточения усилий на поиске ее неизвестных параметров. В работе [95] развивается этот путь в направлении поиска структуры фильтров.
Большое развитие получили методы оптимального управления несколькими взаимосвязанными динамическими системами с децентрализованным управлением. Структура управления таким комплексом систем строится на основе нескольких локальных управляющих устройств , причем каждый локальный регулятор uK(t,xK) управляет только локальным входом и контролирует только локальный выход хк: к — 1, су. Тем не менее, все эти устройства участвуют в управлении всей системой в целом [65] с вектором состояния х. С точки зрения информированности ситуация состоит в следующем. Для всего комплекса систем весь вектор состояния измеряется полностью, однако стратегия управления должна быть построена в децентрализованном виде, т.е. весь вектор управления и составляется из локальных стратегий uK(t, хк), где хк - локальный вектор состояния к-ой подсистемы, к = 1,сх. В этой области имеется большое количество работ. Для анализа структуры системы применяется метод декомпозиции [65, 66]. Качественный анализ синтезированного управления проводится с использованием векторных функций Ляпунова [67, 72]. Поскольку оптимального управления получить не удается, многие останавливаются на иоиске субоптимального управления [65]. Поэтому метод возмущений [68], так же как и его обобщение метод агрегирования [69], оказываются полезными в задачах синтеза децентрализованного управления динамическими системами, которые можно агрегировать более простыми структурами. Стоит отметить, что существует очень мало работ по децентрализованному управлению дискретными системами с неполной информацией [71].
Для дискретных систем управления с полной информацией разработаны многочисленные методы управления [79, 80]. Однако, имеется направление в теории оптимального управления, которое трактует этот вариант управления как синтез кусочно - постоянного управления при полных измерениях вектора состояния непрерывной модели системы в дискретные моменты времени [6]. С точки зрения информированности об объекте это означает, что информация о динамике системы доступна лишь в дискретные моменты времени, а во все оставшиеся моменты информация о системе отсутствует. Кроме того, управление в промежуточные между интервалами измерения время не может быть скорректировано и должно оставаться постоянным на каждом таком подынтервале.
Исследований, посвященных дискретным системам управления с неполной информацией, довольно мало. В качестве примеров работ в этом направлении можно привести [84]-[87], в которых предлагаются достаточные условия оптимальности частично дискретно наблюдаемых диффузионных процессов. Развитие направления, соответствующего этому варианту, проводится в работе [88], в которой стратегия управления базируется на основе дискретных наблюдений в различные моменты времени.
Важной задачей в теории управления стохастическими системами является задача получения численных методов синтеза оптимального управления. Этим вопросам посвящены работы [37]-[39]. Основной принцип, заложенный в этих методах, заключается в том, что, если имеется некоторая стратегия управления, то метод должен позволять найти такую стратегию, которая будет лучше относительно заданного функционала. Во всех случаях исследователи предлагают рассматривают дискретную аппроксимацию непрерывных систем, в связи с чем возникает эффект неустойчивости итерационных методов [40], а также вопрос об асимптотической сходимости методов последовательных приближений [41].
Другим эффективным методом синтеза является спектральный [42], основанный на алгебраической форме связей между характеристиками системы, позволяющий получать количественные характеристики по матрично-операторным формулам. Для этого направления создано алгоритмическое и программное обеспечение [43], получены достаточные условия оптимальности для систем со случайной структурой при неполной информации [44].
В диссертационной работе помимо общих условий оптимальности в задачах управления стохастическими квазилинейными системами с неполной обратной связью по состоянию представлены условия оптимальности в задачах синтеза стратегий оптимального управления линейными стохастическими системами с неизмеряемыми возмущениями в матрицах системы и информационными ограничениями, а также квазилинейными стохастическими системами при неточном измерении состояния и реализации управления в условиях информационных ограничений. Отметим результаты, достигнутые другими авторами в этом направлении. Существует группа работ, посвященных управлению системами со структурной неопределенностью, в которых удается либо синтезировать оптимальное управление [109] с использованием методов теории оптимального управления системами с распределёнными параметрами, либо исследовать робастность таких систем [110, 111]. В [112, 113] исследован вариант, когда случайным образом изменяется не структура динамической системы, а лишь отдельные её параметры.
Для более детального обоснования на содержательном уровне научной новизны получаемых условий оптимальности приведем исследуемую в главе 1 постановку задачи управления частично наблюдаемым диффузионным процессом. При этом во введении для простоты изложения не всегда будем оговаривать теоретико-функциональные требования к встречающимся функциям. Эти требования будут строго даны в основном тексте диссертации.
Процесс управления описывается системой уравнений Ито [28] dxi(t) = fi{t, x(t),u(t, x(t)))dt + gu(t, x(t), u(t, x(t)))dwi(t), x(t0) — x0. Здесь t £ T = [to',ti] С R1 - время; x — ., xn)T - состояние системы, i — 1 , n; ж о - случайный вектор; W[ - стандартный винеровский процесс, I = и = (ui,.,um)T 6 U С Rm - вектор управления; (i, х) —> u(t, х) : Т X Rn —> U С Rm - управление (стратегия управления процесса). Здесь и далее по дважды встречающимся в произведении функций индексам проводится суммирование.
Предполагается, что динамика плотности вероятности состояния удовлетворяет уравнению Фоккера-Планка-Колмогорова [28] dp(t, х) д д2 т^— = -faTlfifo xi х)1 + дд-.д^.К/^ х, u(t1 x))p(t> p(t0,x) =ро(х), где aij = gu gij/2.
Введём функции, описывающие в момент t плотность распределения вероятности t p*(t) = p(t, ■) : Т —> и управление t —> u*(t) = ■) : Т V, где Ср - пространство дважды непрерывно дифференцируемых плотностей вероятностей на пространстве а У - множество, задающее информационные ограничения (подробнее о множестве V см. § 1.4). Будем предполагать, что начальное состояние ж о определяется плотностью ро = р*(to). Через D обозначим множество процессов управления 2: = (р*('),и*(-)).
Ставится задача поиска минимума d — min2 J(z), z (Е D и процесса z = (р* (•),?!*(•)) Е -D, на котором J(z) — d для заданного функционала z J(z) : D Д1, где Г ( г
Jt0 J Rn
В диссертации рассматриваются задачи оптимизации динамических систем с информационными ограничениями, состоящими в том, что каждая компонента стратегии Ui(t,x), г — 1, тп управления может зависеть от своего априори назначаемого набора компонент вектора состояния, в общем случае своего для каждой компоненты.
Сформируем набор функций ua(t, х), а = l,ni, 774 < п. Каждая из функций ua{t,x) представляет собой совокупность всех компонент управления u(t,x) — (ui(t, х),., um(t, х))т, не зависящих от компоненты ха вектора состояния х £ Rn (подробнее см. § 1.4).
Одна из основных идей предложенного в [1, 2] метода Ляпунова-Лаграпжа состоит в замене поставленной задачи с информационными ограничениями другой эквивалентной ей задачей посредством введения x,u(t, x))p(t, x)dxdt + I Fc(x)p{t\,x)dx.
JR" новых дифференциальных связей вида
-—ua(t, ж) = 0, а = 1, пь х е Rn, дха д задающих информационные ограничения.
В [1, 2] получены условия оптимальности для случая, когда вероятностная мера, задающая распределение вектора состояния процесса, может не иметь плотность. Здесь рассматривается случай, когда эта мера имеет плотность q(-) € Ср.
Для получения достаточных условий оптимальности вводится класс Ф вектор-функций Ляпунова - Лагранжа tp = (</з°, уз1,., уз711), где t, q) уз°(*, q) :Т хСр Я1, (t, ж, иа, д) -> уза(£, ж, q):TxRnxRmX
Ср —>• Д1, а = удовлетворяющих определённым условиям [1, 2]. Строятся конструкции: где £ - производная Фреше функции (/9° по переменной q Е Ср.
Для отыскания оптимального элемента ~z Е jD, т.е. такого, что J(^) = d доказано утверждение:
Теорема. Если процесс z = (р*(■), и*(•)) Е D удовлетворяет условиям
H{t, ж, и, g) = fi + ^ aij + /с) q + уз! а а) = min^y,^ 5(4, б) Gtf(t1))=mmq€(?pG(q), то он оптимален.
Дадим определение экстремали, как это сделано в [2]. Эстремалью называется процесс {&*{-), и*{')) £ D, на котором выполняется условие Ь) и условие стационарности в экстремальной задаче а). Далее это определение будет несколько видоизменено, но его содержательный принцип останется тем же.
Характерной чертой представленных в теореме условий оптимальности является то, что операция минимизации по управлению производится локально в каждой точке фазового пространства так же, как и в условиях оптимальности для детерминированных систем [3]-[5]. Необходимые условия, полученные У. Флемингом [45], как и результаты работ [47], [55], не обладают этим свойством. Локальность операции минимизации по управлению позволяет разделить операцию нахождения оптимального управления и операцию поиска вектор-функции ip.
Эти возможности достигаются за счёт того, что в предлагаемой работе, как и в [1, 2], для ограничений информационного типа, представленных в виде дифференциальных связей, вводятся нелинейные функции (р1, ср2,., <£>П1, играющие роль множителей Лагранжа и имеющие достаточную степень свободы для поиска оптимального управления, удовлетворяющего информационным ограничениям. У. Флеминг в [45] так же, как и его последователи, не вводил функций типа множителей Лагранжа для информационных ограничений. Это приводило к тому, что объективно существующие дифференциальные связи, задающие ограничения, непосредственно входили в формулировки условий оптимальности.
В принципе, свойство локальности операции минимизации по управлению для ряда практических задач синтеза оптимального управления с неполной обратной связью, естественно, может оказаться не определяющим, и поэтому задача может быть решена средствами работ [17], [18], [45]-[47], [50]-[54], [84]-[87].
Более того, увеличение размерности пространства, в котором проводится операция минимизации по управлению и добавление функций типа Лагранжа, в принципе, может усложнить решение части конкретных практических задач. Однако, если рассматривать предлагаемый подход с точки зрения его приложения к задачам с более сложными ограничениями информационного типа, то это свойство оказывается принципиальным, например, в задаче синтеза децентрализованного управления. Таким образом, в прикладном плане этот подход может оказаться довольно перспективным.
Пусть теперь задача является квазилинейной, т.е. функции /;(£, ж, и), gu{t,x,u), fc(t:x:u): Fc(x) имеют вид fi{t, х, и) = Ais(t)xs + Bia(t)ua, gu(t, x, и) = Gus{t)xs + Fua(t)ua + Cu(t), f°(t,x,u) = ^Dij(t)xixj + Sai(t)xiUa + ]^Eap(t)uaup,
F (ж) — ~QijXiXj.
Считается, что для рассматриваемого здесь процесса плотность вероятности состояния p(t, х) существует и удовлетворяет уравнению Фоккера-Планка-Колмогорова с начальной плотностью p(to, х) = Ро(х). Начальная плотность имеет математическое ожидание то, ковариационную матрицу Kq и считается заданной.
Центральным и одним из основных результатов диссертации является следующая теорема.
Теорема. Для того, чтобы процесс z = (р*(•), и*(■)) Е D был экстремалью, достаточно существования функций га(£), K(t), P(t), L(t), H(t), 7(t), Xi (t), Mij(t), i, j — 1, n, удовлетворяющих условиям 1) dt dK dm Aum — BL, dt где
Au — A — BP, Q = (C + T(m)) (c + T(m)) , Tils = GiZs - £ FilaPaS:
ТП
Yij(m) = Сц = — FuaLa + Cjj, a=l а также начальные условия для этих уравнений m(t0) = wo, -К"(*о) = Яо
Здесь Т^ - матрица размерности п х п, составленная из элементов YfZs, s = l, п), причем, для Т« ведётся суммирование по всем Z. 2) \FsiaFkipMskLaLp — BsaLaXs— —\{FsiaCki + FklaCsl)MskLa + \CsiCkiMsk + \EapLaLp = 0, — \Msk(GsuFkia + GkliFsla)La + \MskFsiaFkipPaiLp + \FsiaFkipPpiLaMsk+ +\{GsuCki + GkuCsi)Msk — \{FaiaCki + FkiaCsi)PaiMsk — BsaPaiXs + AsiXs— —SaiLa + \EapP(xiLfj + ^EapPpiLa — BsaMiSLa = 0, + ArfMjg + AusjMis - \Msk(GsliFkia + GkliFsla)Paj--\Msk{GsijFkla + GkljFsia)Pai + \MskFslnFklpPMPPj + \MskFslaFklpPajPpi+
Dij Paj ^atj Pai 2 P Pfij "I- 2 P P^J Pfti
MskGsuGkij + \MskGsijGku = 0 и условиям при t — t\
7(*i) = 0, Ai(ti) = 0, Мфг) = Qij. 3) Стратегия управления выбирается в виде линейной функции от состояния системы: иа = — (Ракхк-I- La), а = 1, га, к = 1, п. Матрицы Р и L вычисляются по следующим формулам
-1
Е + I (е + 0Т) + + S - ЯАГ1
Z Z
L =
Е + i (в + @т) Z
Л-Ь-Г + Я^т где Msk(GsuFkla + GkuFsia), а = 1, т, i = 1, n;
Та = Msk{FslaCkl + FkiaCsi), а = 1, m;
0" = FsliFkijMsk, г, j = 1, т. 4) Выполнено условие Е + | (© + ©Г) > 0.
Ненулевые элементы матрицы Я = ЛЯ* находятся из системы уравнений
А<
E + l(Q + QT)
1 -1 ту—1
В1 М + -R + S - {АН*)К 0.
Здесь Л - линейный оператор структуры управления [2], который определён на множестве матриц размеров тп х п и принимает значения на том же множестве. Оператор Л переводит матрицу Н с элементами в матрицу К с элементами = К^-, если компонента щ стратегии управления не должна зависеть от компоненты Xj , и = 0 в противном случае.
Для синтеза оптимального управления с помощью этой теоремы необходимо решить краевую задачу для системы обыкновенных дифференциальных уравнений типа Риккати.
Полученные в диссертации условия оптимальности позволяют решать задачи оптимального управления линейными стохастическими системами со случайными возмущениями в матрицах системы и квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления.
Достоверность научных утверждений и выводов, представленных в диссертационной работе, подтверждена строгими математическими доказательствами, численными экспериментами, сравнением полученных результатов с уже существующими.
Апробация работы и публикации. Существенные результаты диссертации получепы в рамках программы "Развитие научного потенциала высшей школы" Министерства Образования РФ (per. N 4549, 2005 г.), а также поддержаны грантом РФФИ (N 06-08-00398). Основные результаты опубликованы в журнале "Известия РАН. Теория и системы управления" [126, 127], а также в [128, 129], обсуждались на международных конференциях [130]-[134] и научных семинарах Московского авиационного института в 2007 г.
Личный вклад автора. В [126], [130] разработаны достаточные условия оптимальности для квазилинейных стохастических систем при информационных ограничениях. В [127] созданы численные методы для решения рассмотренных в [126], [130] задач. В [133] проведено обобщение для задач синтеза оптимальных стратегий управления в случае, когда динамическая система управляется неточно и при реализации состояния системы имеются случайные ошибки измерения, также сделано обобщение для задач синтеза оптимальных стратегий управления линейными системами, имеющих в матрицах неизмеряемые возмущения. Показано, что для таких задач могут быть использованы предложенные условия оптимальности. В [127] разработаны численные методы. А в [129], [131], [132], [134] выполнены численные расчёты и синтезировано оптимальное управление для прикладных задач.
Диссертация состоит из введения, пяти глав, заключения и библиографического списка из 134 наименований. Работа изложена на 139 страницах машинописного текста, содержит 14 рисунков и 6 таблиц.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Синтез оптимальных регуляторов в автоматических системах при случайных возмущениях1983 год, доктор технических наук Колосов, Геннадий Евгеньевич
Методы синтеза многосвязных систем управления с неполной информацией о состоянии, параметрах и возмущениях на основе матричных уравнений и передаточных матриц2000 год, доктор технических наук Перепелкин, Евгений Александрович
Задачи многократной коррекции управляемых систем2012 год, кандидат физико-математических наук Гредасова, Надежда Викторовна
Алгоритмы, основанные на методе функций Ляпунова и теории разностных схем, обеспечивающие техническую устойчивость динамических систем1998 год, кандидат физико-математических наук Тарасов, Анатолий Пантелеймонович
Минимаксные методы оценивания и оптимизации процессов в неопределенно-стохастических системах1998 год, доктор физико-математических наук Панков, Алексей Ростиславович
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Румянцев, Дмитрий Станиславович
5.3. Выводы
Рассмотрены примеры задач управления различными летательными аппаратами. Разработанная теория позволяет эффективно управлять ДА при различном составе измеряемых координат, что делает вывод о возможности её использования для управления реальными техническими объектами.
Заключение
В диссертационной работе предложено решение проблем оптимального управления квазилинейными стохастическими системами диффузионного типа с информационными ограничениями, выразившееся в следующих результатах:
1. Получены конструктивные условия оптимальности и разработаны методы оптимизации стратегий управления, зависящих от известных компонент вектора состояния, в задачах управления стохастическими квазилинейными системами с квадратичным критерием качества; линейными стохастическими системами со случайными возмущениями в матрицах системы; квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления.
2. Разработаны три схемы численных методов поиска стратегий оптимального управления диффузионными стохастическими процессами общего вида при наличии информационных ограничений.
3. Для задач оптимального управления стохастической квазилинейной системой указанные в п. 2 схемы численных методов конкретизированы в виде конструктивно реализуемых вычислительных процедур.
4. Для решения задачи оптимального управления стохастической квазилинейной системой управления с квадратичным критерием качества создан программный комплекс, позволяющий численно решать поставленную задачу.
5. Проведена апробация предложенных теоретических результатов на тестовых прикладных задачах управления различными летательными аппаратами, решения которых демонстрируют применимость предложенной теории к задачам оптимального управления сложными техническими объектами.
Список литературы диссертационного исследования кандидат физико-математических наук Румянцев, Дмитрий Станиславович, 2009 год
1. Хрусталёв М.М. Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности о состоянии
2. Достаточные условия равновесия // Изв. РАН. Теория и системы управления. 1995. N 6.
3. Хрусталёв М.М. Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности о состоянии1.. Метод Лагранжа // Изв. РАН. Теория и системы управления. 1996. N 1.
4. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961. - 392 с.
5. Беллман Р. Динамическое программирование. М.: Мир, 1974. - 207 с.
6. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. - 446 с.
7. Гурман В.И. Принцип расширения в задачах управления. -М.: Физматлит, 1997. 287 с.
8. Хрусталёв М.М., Савастюк С.В. Условия оптимальности стохастических систем диффузионного типа в задачах сограничениями на процесс управления-наблюдения // Доклады Академии наук СССР. 1990. - т. 311, N 2. - с. 291 - 295.
9. Хрусталёв М.М., Савастюк С.В. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления наблюдения. I // Автоматика и телемеханика. - 1991. - N 7. -с. 89 - 97.
10. Хрусталёв М.М., Савастюк С.В. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления наблюдения. II // Автоматика и телемеханика. - 1991. - N 8. -с. 94 - 101.
11. Хрусталёв М.М., Савастюк С.В. Достаточные условия оптимальности стохастических систем в задачах с ограничениями на процесс управления наблюдения // Статистические методы в теории управления ДА: Тем. сб. науч. тр. / МАИ. М., 1990. - с. 4 - 10.
12. Савастюк С. В. Оптимизация параметрически связанных стохастических систем со структурой децентрализованного управления // Оптимизация структур и параметров систем автоматического управления JIA: Тем. сб. научн. тр. / МАИ. М. 1991. с. 24 - 33.
13. Плотников М.Ю., Хрусталёв М.М. Условия глобальной оптимальности стратегий управления диффузионными процессами с возможностью обрыва траекторий при неполной информации о состоянии // Изв. РАН. Теория и системы управления. 2005. - N 1.
14. Москаленко А.И. Методы нелинейных отображений в оптимальном управлении. Новосибирск: Наука, 1983.
15. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.
16. Овсянников Д.А. Математические методы управления пучками. -Л.: ЛГУ, 1980. 228 с.
17. Кирин Н.Е. Метод оптимального демпфирования в задачах управления с неполной обратной связью // Вопр. мех. и процессов управления. Л. Изд-во Ленингр. ун-та. 1989. - Вып. 12. - с. 110 -117.
18. Семёнов В.В., Пантелеев А.В. Достаточные условия оптимальности управления ансамблем траекторий нелинейных динамических систем // Дифференциальные уравнения. 1985. - т. 21, N 4. - с. 628 -636.
19. Бортаковский А. С. Достаточные условия оптимальности управления пучками траекторий нелинейных детерминированных систем.- М., -1985. 22 с. - Деп. в ВИНИТИ 18.06.85, N 4291-85.
20. Kurzhanskii А.В, Filippova T.F. Dynamics of the set of viable trajectories to a differential inclusion: the evolution equation // Пробл. управл. и теории информ. (Problems of control and information theory). 1988. -т. 17, N 3, - c. 137 - 144.
21. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. - 320 с.
22. Хрусталёв М.М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. I // Автоматика и телемеханика. 1988. - N 5. - с. 62 - 70.
23. Хрусталёв М.М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. II // Автоматика и телемеханика. 1988. - N 7. - с. 70 - 80.
24. Петров А. И., Минин В. В. Аналитическое конструирование регуляторов при неполных наблюдениях // Аналитические методы синтеза регуляторов: Тем. сб. науч. тр./ Саратов: СПИ. 1977. - с. 88 -104.
25. Куржанский А. В. О синтезе управлений по результатам измерений // Прикл. матем. и мех. (Москва). 2004. v. 68. -N 4.
26. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Построение оптимальных обратных связей по математическим моделям с неопределенностью. // Ж. вычисл. матем. и матем. физ. 2004. 44, N 2.
27. Габасов Р., Кириллова Ф.М., Костюкова О.И. Синтез оптимальных управлений для динамических систем при неполной и неточной информации об их состояниях // Труды Математического инта РАН. 1995. - 211. - с. 140 - 152.
28. Третьяков В.Е., Целищева И.В., Шишкин Г.Е. Оптимальное управление системами с неполной и неточной информацией // Тр. Ин-та мат. и мех. УрО РАН. 1992. - 2.-е. 176 - 187, 228.
29. Пугачёв B.C., Синицин И.Н. Стохастические дифференциальные системы. М.: Наука, 1985. - 559 с.
30. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978 - 318 с.
31. Параев Ю.И. Введение в статистическую динамику процессов управления и фильтрации. М.: Сов. радио, 1976, - 184 с.
32. Ahmed N. U., Тео K.L. Existence theorem on optimal control of partially observable diffusions // SIAM J. Contr. 1974. - N 12(3). - p. 351 - 374.
33. Ahmed N. U. Existence of optimal band limited controls without convexity condition // Int. J. Contr. 1976. - N 31(3). - p. 201 - 215.
34. Ahmed N.U. Existence of optimal control for systems governed by Ito stochastic differential and functional equations // Not. Am. Math. 1975. -N 22(1). - p. 257- 260.
35. Benes V.E. Existence of optimal strategies based on specified information for a class of stochastic decision problems // SIAM J. Contr. 1970. -N 8(2). - p. 179 - 185.
36. Benes V.E. Existence of optimal stochastic control laws // SIAM J. Contr. 1971. - N 9(3). - p. 446 - 450.
37. Noussair E.S., Nababan S., Teo K.L. On the existence of optimal controls for quasilinear parabolic partial-differential equation //J. Optim. Th. & appl. 1981. - N 34(1). - p. 99 - 115.
38. Christopeit N. Optimal stochastic control with special information patterns // SIAM J. Contr. 1980. 18(5). - p. 559 - 575.
39. Davis M.H.A., Varaiya P. Dynamic programming conditions for partially observable stochastic systems // SIAM J. Contr. 1973. - p. 226 - 221.
40. Yavin Y Computation of suboptimal randomized strategies for steering the random motion of a point under partial observation // J. Optim. Th. & Appl. 1984. - N 44(1). - p. 159 - 179.
41. Васильев Ф.П. Лекции по методам решения экстремальных задач. -М.: Издательство Московского университета. 1974. - 374 с.
42. Колосов Г.Е. Синтез оптимальных автоматических систем при случайных возмущениях. М.: Наука. Главная редакция физико-математической литературы. - 1984. - 256 с.
43. Солодовников В.В., Семёнов В.В Спектральный метод расчёта нестационарных систем управления JIA. М.: Машиностроение 1975. -272 с.
44. Семёнов В.В., Рыбин В.В. Алгоритмическое и программное обеспечение расчета нестационарных непрерывно-дискретных систем управления JIA спектральным методом. М.: МАИ. - 1984. - 84 с.
45. Рыбаков К.А. Спектральный метод анализа и синтеза систем со случайной структурой. Диссертация на соискание уч. ст. к.ф.-м.п. -М.: МАИ, 2005.
46. Fleming W.H. Optimal control of partially observable diffusions // SIAM J. Control. 1968, v. 6, - N 2. - p. 194 - 214.
47. Семёнов В.В. Синтез алгоритмов управления нелинейными системами при случайных воздействиях с ограниченным составом точных измерений // Аналитические методы синтеза регуляторов: Тем. сб. науч. тр. / Саратов: СПИ. 1978. Вып. 3. - с. 3 - 20.
48. Mortensen R.E. Apriori open loop control of conditions time systems // Int. J. Control. 1966. - v. 3. N 2. - p. 113 - 127.
49. Florentin R.E. Optimal control of noisy system // J. of Control. 1962. v. 12.
50. Розенберг Г.С. Достаточные условия оптимальности динамических систем, описываемых стохастическими дифференциальными уравнениями // Автоматика и телемеханика. 1970. - N 12. - с. 59 - 67.
51. Пантелеев А.В. Синтез оптимального управления стохастическими системами с неполной непрерывной информацией // Математические задачи управления движущимися объектами: Тем. сб. науч. тр. / МАИ, М., 1987. - с. 16 - 22.
52. Пантелеев А.В., Семёнов В. В. Оптимальное управление вероятностными системами по неполному вектору состояния // Автоматика и Телемеханика. 1984. N 1. - с. 91 - 100.
53. Бортаковский А.С. Проекционно оптимальное управление детерминированными системами с неполной обратной связью // Новые задачи оптимизации авиационных систем: Тем. сб. научн. тр. / МАИ, М., -1989. - с. 4 - 10.
54. Рудепко Е.А. Синтез конечномерного алгоритма управления частично наблюдаемым стохастическим объектом / / Задачи стохастического управления: Тем. сб. научн. тр. / МАИ. М. -1986.
55. Пантелеев А.В. Оптимальное управление непрерывными системами при неполной непрерывной мгновенной информации о состоянии: Препринт/ МАИ. М., 1990. 55 с.
56. Katz S. Best endpoint control of noisy systems // J. of Electr. and Control. 1962. v. 12. - N 4. - p. 323 - 343.
57. Бутковский А. Г. Управление системами с распределенными параметрами (обзор) // Автоматика и телемеханика. 1979. N 11. -с. 16 - 65.
58. Бутковский А.Г. Обзор некоторых новых направлений, идей и результатов в проблеме управления системами с распределёнными параметрами // Изв. АН СССР, Техн. киберн. 1983. - N 2. - с. 112 -122.
59. Сиразетдииов Т.К. Оптимизация систем с распределёнными параметрами. М.: Наука, 1977. - 479 с.
60. Сиразетдинов Т.К., Дегтярев Г.Л. Синтез оптимального управления в системах с распределёнными параметрами при неполном измерении состояния (обзор) // Изв. АН СССР. Тех. кибернетика. 1983. - N 2. -с. 123 - 136.
61. Егоров А. И. Оптимальное управление тепловыми и диффузионными процессами. М.: Наука, 1978. 463 с.
62. Лионе Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. М.: Мир, 1972. 414 с.
63. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975. 478 с.
64. Хрусталёв М.М. Достаточные условия оптимальности в задачах с ограничениями: Диссертация на соискание уч. ст. к.ф.-м.н., М.: МГУ, 1969.
65. Рафатов P.P. Исследование задачи оптимизации процессов переноса при неполных измерениях. // Мат. методы оптимиз. АН Респ. Кыргызстан. Ин-т автомат. Бишкек, 1992. - с. 65-78.
66. Шилъяк Д. Децентрализованное управление сложными системами: Пер. с англ. / М.: Мир, 1994. 575 с. - ISBN 5-03-003106-5.
67. Saberi A., Khalil Н. Decentralized stabilization of a class of nonlinear interconnected systems // Int. J. Control. 1982. - v. 36, N 5. - p. 803 -818.
68. Hahn W. Theory and application of Liapunov's direct method. Engle-wood. cliffs HJ: Pretice Hall, - 1963.
69. Kwatny H.J., Spare J.H., Massino F.M. Perturbation methods in the construction of model decomposition for large scale systems analysis. Drexel Univ. Rep. Aug. - 1977.
70. Davison E.J. A new method for simplifying linear dynamic systems // IEEE Trans. Auto. Control. 1968. AC - 13(2). Apr. - p. 214 - 215.
71. Vesely V. Decentralized control of linear dynamical systems with partial aggregation // Kybernetika. 1989. - v. 25. N 5. - p. 408 - 418.
72. Chammas A.B. Decentralized control of discrete time linear system with incomplete information // Int. J. Contr. - 1982. - N 36(4). - p. 575 - 587.
73. Мисриханов М.Ш. Аналитический синтез оптимального управления децентрализованными системами. // Современные методы управления многосвязными динамическими системами.: Сборник. Вып. 1 М.: ЭнергоАтомИздат. 2003. с. 615-623
74. Константинов Р.В. О линейной дифференциальной игре преследования с неполной фазовой информацией // Некоторые проблемы совр. матем. и их прил. к задачам физ. и мех. / Моск. физ.-техн. ин-т. М., 1995. с. 98-110.
75. Слепцов С. В., Третьяков В.Е. Линейно-квадратичная игра с неполной информацией // Тр. Ин-та мат. и мех. УрО РАН. 1992. -2. - с. 166-175,227.
76. Румянцев А.Е. Достаточные условия существования решения в линейных дифференциальных играх при неполной информации. // Проблемы динамического управления: Сборник научных трудов.
77. Вып. 1. МГУ. М.: Изд-во Фак. вычисл. матем. и кибернет. МГУ, 2005, с. 268-288
78. Пшеничный Б.Н. Об одной специальной задаче преследования при неполной информации // Кибернетика и системный анализ 1995. -N 2. - с. 106-112.
79. Жуковский В.И., Молоствов B.C. Многокритериальная оптимизация систем в условиях неполной информации М.: МНИИПУ, 1990. 112 с.
80. Докучаев Н.Г. Управление диффузией кордесовского типа с неполными наблюдениями в игровой задаче // Дифференц. уравн. -1996. 32, N 8. - с. 1051-1062.
81. Болтянский В.Г. Оптимальное управление дискретными системами. М.: Наука, 1973.
82. Пропой А.И. Элементы теории оптимальных дискретных систем. -М.: Наука, 1973. 256 с.
83. Чебыкин Л. С. Условия оптимальности дискретно-непрерывных систем // Оптимальное управление системами с неопределенной информацией: Тем. сб. науч. тр. / Свердловск: УНЦ АН СССР. -1980. с. 132 - 140.
84. Бортаковский А.С., Пантелеев А.В. Достаточные условия оптимальности управления непрерывно дискретных систем // Автоматика и телемеханика. - 1987. - N 7. - с. 57 - 66.
85. Андреева Е.А. Необходимые и достаточные условия оптимальности для дискретных управляемых процессов // Изв. АН СССР. сер. Техп. киберн. 1989. - N 2. - с. 183 - 190.
86. Пантелеев А.В. Синтез оптимального управления непрерывными стохастическими системами при неполной дискретной информации // Статистические методы в теории управления JIA: Тем. сб. науч. тр./ МАИ, М. , 1990. с. 10 - 19.
87. Пантелеев А.В. Достаточные условия оптимальности дискретного управления непрерывными детерминированными системами//Анализ и синтез систем управления JIA: Тем. сб. науч. тр. / МАИ, М., 1987. -с. 44 50.
88. Panteleyev A.V. Optimal control of continuous-time deterministic systems with incomplete discrete feedback //J. Optimiz. Theory and Appl. -1990. 64, N 3. - c. 557-571.
89. Руденко Е.А. Достаточные условия оптимальности конечномерного стохастического управления летательным аппаратом по дискретным измерениям // Новые задачи оптимизации авиационных систем: Тем. сб. научн. тр. / МАИ, М. 1989. с. 18 - 26.
90. Дарховский Б.С. Локально-оптимальная стабилизация при неполной информации // Автомат, и телемех. 1997. - N 4. - с. 144^154.
91. Гаврина О.М. Синтез дискретных регуляторов линейных систем при неполной обратной связи // Вестн. С.-Петербург, ун-та. Сер. 1. 1993. -N 3. - с. 8-13.
92. Заика Ю.В. Дискретная стабилизация динамических систем с неполной обратной связью // Вестн. С.-Петербург, ун-та. Сер. 1. -1992. N 3. - с. 24-31.
93. Kalman R.E., Вису R.S. New results in linear filtering and prediction theory // J. Basic Eng., Trans. ASME, Ser. D, 83, 1961 p. 95 - 108.
94. Стратанович P. JI. Условные марковские процессы и их применение к теории оптимального управления. М.: Изд-во МГУ, 1966.
95. Пугачёв В. С. Обобщение теории условно оптимального оценивания и экстраполяции // Докл. АН СССР. 1982. - т. 262, N 3. - с. 535 - 538.
96. Руденко Е.А. Оптимальная структура нелинейных фильтров конечного порядка: Препринт / МАИ. М., 1989 61 с.
97. Сейдж, Э., Меле Дж. Теория оценивания и ее применение в связи и управлении. М.: Связь, 1976. - 495 с.
98. Смирнов Н.В. Стабилизация билинейной нестационарной системы в случае неполной обратной связи // Вести. С-Петерб. Ун-та. Сер. 1. 2000, N 4, с. 28-34, 102.
99. Кирии Н.Е. Метод оптимального демпфирования в задаче терминального управления по неполной обратной связи с учётом возмущений // Ред. ж. Вестн. С.-Петербург, гос. ун-та. Мат., мех., астрон. СПб, 1997. - 15 е.: Деп. в ВИНИТИ 18.11.97, N 3366-В97.
100. Садомцев Ю.В., Иванов Д. В. Оптимальное управление в линейных системах при неполной информации о векторе состояний / Саратов. Гос. Техн. ун-т. Саратов, 1997. - 12 с. Деп. в ВИНИТИ 07.02.97, N 383-В97.
101. Ворохобко Ю.А., Лебедев А.Л. К теории построения оптимальных регуляторов в колебательных системах при неполной информации // Изв. АН СССР. Техн. кибернет. 1991. - N 6. - с. 87-93.
102. Stoorvogel Anton A., Saberi АН, Chen Ben М. Full and reduced-order observer-based controller design for ^-optimization // Int. J. Contr. -1993. 58, N 4. - c. 803-834.
103. Мартьянов А.С. Динамический метод невязки в задаче реконструкции входов при неполной информации //Ж. вычисл. мат. и мат. физ. 2005. 45, N 2.
104. Короткий А.И. О динамической реконструкции управлений и параметров в условиях неполной информации о системе // Дифф. уравн. -1999. 35, N 11, с. 1482-1486.
105. Newmann М.М. Optimal and suboptimal control using an observer when some of the state variables are not measurable // Int. J. Contr. 1969. -AC - 9. - N 3. - p. 281 -290.
106. Sarma V. V.S., Deekshatulu B.H. Optimal control when some of the state variables are not measurable // Int. J. Contr. 1968. v. 7. - N 3. - p. 251 -256.
107. Bensoussan A., J.H. van Schuppen Optimal control of partially observable stochastic systems with an exponential-of-integral perfomance index 11 SIAM J. Contr. 1985. - v. 23. - N 4.
108. Малышев В.В., Кибзун А.И. Новые методы высокоточного управления летательными аппаратами. М.: Машиностроение, 1987.
109. Сиротин А.И. Об условиях разрешимости класса задач управления дискретными системами с аддитивными случайными возмущениями // Изв. РАН. Теория и системы управления. -2003.- N 3. с. 17-29.
110. Соколов С.В., Щербень И.В. Синтез оптимального управления динамическими структурами // Прикл. матем. и мех. (Москва). -1999. 63, N 2 - с. 231-236.
111. Саг Xiu-Shan, Han Zheng-Zhi, Tang Hou-Jun Control Lyapunov stabilization of nonlinear systems with structural uncertainty // J. Shanghai Jiaotong Univ. Sci. 2005. - 10, - N 1, - p. 21-24.
112. Imai H. Robust output regulation for linear systems with structured uncertainly // Int. J. Contr. 1997. - 66, N 4. - c. 499-515.
113. Черноусъко Ф.Л. Оценка множества достижимости линейных систем с неопределенной матрицей // Докл. РАН. 1996. - 349, N 1. - с. 32-34.
114. Bismut J.M. Linear quadratic optimal stochastic control with random coefficients // SIAM J. Contr. 1976. - v. 14. - N 3.
115. Flemming W.H. Optimal control of partially observable diffusions // SIAM J. Control. 1968. т. 6. N 2.
116. Моисеев H.H. Численные методы в теории оптимальных систем., М.: Наука, 1971.
117. Беллман Р., Калаба Р. Квазилинеаризация и нелинейный динамический анализ // М.: Мир, 1968.
118. Семёнов В.В., Пантелеев А.В., Руденко Е.А., Вортаковский А.С. Методы описания, анализа и синтеза нелинейных систем управления. -М.: Изд-во МАИ, 1993. 312 с.
119. Крылов И.А., Черноусько Ф.Л. О методе последовательных приближений для решения задач оптимального управления. // Журнал вычислительной математики и математической физики. 1962, т. 2, N 6.
120. Савастюк С.В., Хрусталёв М.М. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления-наблюдения // АиТ 1991. N 7,8.
121. Пантелеев А.В., Jlemoea Т.А., Вортаковский А.С. Оптимальное управление в примерах и задачах // М.: МАИ, 1992.
122. Киреев В.И., Пантелеев А.В. Численные методы в примерах и задачах.// М.: МАИ, 2000.
123. Малышев В.В. Спутниковые системы мониторинга, М.:, Наука, 2000.
124. Белецкий В.В. Движение искусственного спутника относительно центра масс, М.: Наука, 1965.
125. Белецкий В.В. Движение спутника относительно центра масс в гравитационном поле, М.: Наука, 1975.
126. Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами, М.: Машиностроение, 1987.
127. Румянцев Д.С., Хрусталёв М.М. Оптимальное управление квазилинейными системами диффузионного типа при неполной информации о состоянии // Изв. РАН. Теория и системы управления. 2006. - N 5. - с. 43-51.
128. Румянцев Д.С., Хрусталёв М.М. Численные методы синтеза оптимального управления для стохастических динамических систем диффузионного типа // Изв. РАН. Теория и системы управления. -2007. N 3. - с. 27-38.
129. Румянцев Д. С. Компьютерная программа расчёта оптимального управления квазилинейными системами диффузионного типа при информационных ограничениях // Промышленные АСУ и контроллеры 2007. - N 9. - с. 28-32.
130. Хрусталёв М.М., Румянцев Д. С. Синтез стратегий оптимального управления гибким спутником при информационных ограничениях // Вестник МАИ. 2008. - т. 15. - N 2. - с. 147-154.
131. Хрусталёв M.M., Румянцев Д. С. Оптимизация конструкции квазилинейного демпфера колебаний самолета при взлете и посадке // Тезисы докладов 3-ей Международной конференции "Авиация и космонавтика-2004", г. Москва, 2004. 1 с.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.