Алгоритмы стабилизации параметров технологических объектов, использующие условную плотность вероятности тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Бендич, Нина Николаевна

  • Бендич, Нина Николаевна
  • кандидат технических науккандидат технических наук
  • 1984, Иркутск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 159
Бендич, Нина Николаевна. Алгоритмы стабилизации параметров технологических объектов, использующие условную плотность вероятности: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Иркутск. 1984. 159 с.

Оглавление диссертации кандидат технических наук Бендич, Нина Николаевна

ВВЕДЕНИЕ.

1. СТАБИЛИЗАЦИЯ ОБЪЕКТОВ В УСЛОВИЯХ АПРИОРНОЙ неопределенности. то

1.1. Обзор литературы. ТО

1.2. Управление процессом очистки рассола при 14 производстве хлора и каустика.

2. ПРИМЕНЕНИЕ КРИТЕРИЯ МАКСИМУМА ВЕРОЯТНОСТИ ДЛЯ СТАБИЛИЗАЦИИ СТОХАСТИЧЕСКИХ ОБЪЕКТОВ.

2.1. Постановка задачи.

2.2. Сравнение управлений, полученных при применении критерия максимума вероятности с управлениями по критерию удельного риска.

2.2.1. Линейный объект.

2.2.2. Объект с запаздывающим аргументом.

3. АЛГОРИТМ ВОССТАНОВЛЕНИЯ ФУНКЦИИ ДОСТОВЕРНОСТИ И ЕГО МОДИФИКАЦИИ.

3.1. Восстановление функции достоверности методом потенциальных функций.

3.2. Восстановление функции степени достоверности, как функции от середины интервала задания.

3.3. Использование априорной информации.

4. КРИТЕРИЙ МАКСИМУМА УСЛОВНОЙ ВЕРОЯТНОСТИ И САМООРГАНИЗУЮЩЕЕСЯ УПРАВЛЕНИЕ.

4.1. Алгоритм идентификации функции управления, доставляющей максимум условной вероятности.

4.2. Сходимость алгоритмов идентификации.

4.3. Робастность алгоритмов идентификации управляющего воздействия по критерию условной вероятности.

5. ОПИСАНИЕ ЭКСПЕРИМЕНТОВ И ИХ РЕЗУЛЬТАТЫ.

5.1. Эксперименты по выбору параметров и режимов использования.

5.2. Процесс очистки рассола.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Алгоритмы стабилизации параметров технологических объектов, использующие условную плотность вероятности»

Актуальность работы. В основных направлениях экономическо- ' го и социального развития СССР на I98I-I985 гг. и на период до 1990 года ставится задача: "развивать производство и обеспечить широкое применение . встроенных систем автоматического управления с использованием микропроцессоров и микро-ЭВМ.". Особое внимание обращается на "развитие математической теории, повышение, эффективности ее использования в прикладных целях.".

Все более широкое применение в народном хозяйстве СССР электронно-вычислительной, техники позволяет создавать и применять для управления производственными линиями и процессами новые эффективные способы и алгоритмы. Одной из важных проблем автоматического управления многими сложными процессами, в том числе и технологическими, является задача стабилизации выхода объекта, т.е. поддержание значений выходных параметров в определенных пределах. Синтез же систем управления существенно затрудняется по многим причинам и, презде всего, из-за отсутствия в большинстве случаев математического описания объектов управления', их нелинейностью, многомерностью, наличием большого числа, в общем случае, взаимосвязанных факторов, оказывающих влияние на ход процесса, внешних возмущающих воздействий. Всю информацию получить, обработать и учесть практически невозможно, поэтому многие объекты работают в условиях большей или меньшей априорной неопределенности.

Настоящая работа посвящена разработке применения критерия максимума условной вероятности попадания выхода объекта в заданный интервал при известном состоянии на предыдущем шаге. Применение этого критерия стабилизации позволяет справиться с некоторыми трудностями, связанными с накоплением и статистической обработкой априорной информации, синтез же функции управления, максимизирующей рассматриваемый критерий на каждом шаге, позволяет управлять "дуально", т.е. совместить процесс изучения и управления.

Возможность создавать управляющие воздействия на действующих объектах в реальном масштабе времени, обосновывая их вид с точки зрения выбранного критерия; сокращение этапа предварительного изучения объекта и сбора априорной информации, а также возможность практически немедленного использования данных, полученных в процессе работы, для совершенствования процесса управления делает рассматриваемые в работе проблемы актуальными.

Цель работы заключается в теоретической разработке алгоритмов и способов управления, оптимальных с точки зрения критерия максимума условной вероятности попадания выхода объекта в заданный интервал при извёстном состоянии на предыдущем шаге для дискретных или непрерывных, приведенных к дискретному виду, объектов; выборе параметров, обеспечивающих наилучшую сходимость этих алгоритмов; создании части математического обеспечения АСУ ТП, реализующей разработанные алгоритмы на реальном объекте.

Методы исследования. Для объектов с известным математическим описанием и шумом на входе поставленная задача решается аналитически с применением теории матриц, понятий пространств состояний, стохастических моделей состояний и методов решений дифференциально-разностных уравнений. Для решения задач стабилизации объектов с неизвестным описанием применены метода стохастической аппроксимации.

Ряд вопросов, касающихся выбора параметров, влияющих на сходимость алгоритмов, решается экспериментально с помощью программ реализующих алгоритмы на ЭВМ.

Научная новизна

- Для .дискретных объектов или объектов, допускающих дискретное представление при частично или полностью неизвестном описании, с аддитивной смесью шума и управляющего воздействия на входе предложены алгоритмы, реализующие восстановление функции управления, как функции от состояния (или выхода) на предыдущем шаге, доставляющей максимум вероятности попадания выхода объекта в заданный интервал.

- Для стохастических линейных объектов п -го порядка с известным математическим описанием приведены рекуррентные соотношения, позволяющие вычислять оптимальное, с точки зрения критерия максимума вероятности попадания выхода объекта в заданную область, управление на каждом шаге.

- Для стохастических объектов с запаздывающим аргументом разработан способ управления, использующий критерий максимума вероятности попадания выхода в заданный интервал, сочетающий в себе способы стабилизации выхода с помощью пропорционального и интегрального регуляторов. Если известно математическое описание объекта, оно используется для отыскания точных значений коэффициентов регуляторов.

- На примере линейных стохастических объектов с известным математическим описанием показано, что применение критерия максимума вероятности попадания выхода объекта в заданную область дает те же результаты, что и критерии среднего (в некоторых случаях) и удельного риска с квадратичной функцией потерь.

Практическая ценность и внедрение.

- На примере одного алгоритма рассмотрены возможности увеличения скорости сходимости, при правильном выборе параметров и начальных приближений за счет использования априорной информации об объекте и распределении шума на входе. Проведены соответствующие эксперименты.

- Рассмотрены вопросы повышения помехоустойчивости. Определен выбор полиномов разложения управляющего воздействия, сам вид управляющего воздействия и точность его представления в зависимости от шума, действующего на вход объекта.

- Аналитические выражения для вычисления оптимального управления, полученные в работе, позволяют синтезировать регуляторы различных типов, стабилизирующие выход объекта в смысле предложенного критерия.

- Предложен подход к анализу систем с запаздыванием на основе сравнения величины запаздывания аргумента и периода управления.

- Полученные в работе алгоритмы для стабилизации выхода объекта нашли свое применение в составе АСУ ТП производства хлора и каустика в Усольском ПО "Химпром". Работы находятся на стадии внедрения, расчетный экономический эффект от применения алгоритмов составляет 23,3 тыс.рублей в год, что подтверждается соответствующим актом о внедрении. Разработанные алгоритмы включаются в разрабатываемые Ангарским ОКБА типовые АСУ ТП.

- Предложенные в работе алгоритмы входят в состав разработок подсистемы непрерывного планирования и управления АСУ Минусинского ЭПК, разрабатываемых Отраслевой научно-исследовательской лабораторией АСУП ИЛИ.

Апробация работы. Основные результаты работы докладывались:

- на Всесоюзной научно-технической конференции молодых ученых и специалистов по приборостроению и автоматизации химической промышленности в г.Туле в июне 1973 г.;

- на областной научно-технической конференции молодых ученых в г.Иркутске в мае 1974 г.;

- на Ш и 1У Всесоюзных конференциях по автоматизации научных исследований на основе применения ЭВМ в г.Новосибирске в мае 1979 г. и в мае 1981 г.;

- на Всесоюзном научно-координационном совещании "Проблемы внедрения результатов и оценка эффективности научно-исследовательских работ по разработке, совершенствованию и внедрению АСУП в народном хозяйстве" в г.Иркутске в июне 1982 г.

Публикации. По результатам работы опубликовано 6 печатных работ и отчет по НИР.

Диссертация выполнена на кафедре АСУ Иркутского ордена Трудового Красного Знамени политехнического института и на кафедре "Вычислительная техника" Горьковского ордена Трудового Красного Знамени политехнического института им. А.А.Жданова.

Условные обозначения.

В работе широко применяются следующие обозначения:

У (О - вектор-функция от непрерывного аргумента;

V [К] - вектор-функция, рассматриваемая в дискретные моменты времени;

А,В,С,В- матрицы, используемые для описания объекта управления;

X,V, U - пространства векторов состояния, наблюдения и управления, соответственно;

ОСИ - норма вектора ^ в евклидовом пространстве;

Е(Х) К (sЛ) R (Sjt) ~ математическое ожидание, функции * взаимной и авто-ковариации, соответственно;

R, - $ -мерное евклидово пространство;

PCS[0,oo) - класс непрерывных функций, имеющих непрерывные производные до порядка $ включительно почти всюду на 10, об).

I. СТАБИЛИЗАЦИЯ ОБЪЕКТОВ В УСЛОВИЯХ АПРИОРНОЙ НВОПРЕЩЕДЕННОСТИ

В данной главе делается краткий обзор литературы, имеющей отношение к задаче стабилизации или к выбору критерия управления.

Описывается процесс очистки рассола при производстве хлора и каустика, обосновывается выбор критерия управления, управляющих воздействий и параметров состояния.

I.I. Обзор литературы

Одной из важных проблем автоматического управления многими сложными технологическими процессами является задача стабилизации выхода объекта, т.е. поддержание значений выходных параметров в определенных пределах [I-I8]. Синтез систем автоматического управления (САУ) чаще всего преследует именно эту цель. Существует множество алгоритмов стабилизации, использующих различные критерии. Одним из самых распространенных является критерий минимума среднего или удельного риска [15], последний чаще всего применяется в так называемых "терминальных задачах" [2,9] , хотя для их удачного применения, как правило, требуется предварительное определение закона распределения вероятностей, что может обеспечить лишь большой период наблюдения. Не менее популярными можно назвать стратегии управления, минимизирующие дисперсию [4, 7, II, 19] и использующие байесовский подход [20-22]. Находит применение также множество критериев, разработанных дога определенного класса объектов [3, 5, 23-27].

Синтез же систем управления такими объектами существенно затрудняется по многим причинам, и прежде всего, из-за отсутствия в большинстве случаев математического описания объектов управления. . Идентификация же объекта на действующем производстве представляет значительные трудности, обусловленные нелинейностью, многомерностью и практической невозможностью измерения всех параметров объекта одновременно, вместе с наличием большого числа в общем случае взаимосвязанных факторов, оказывающих влияние на ход процесса. Кроме того, наличие неконтролируемых параметров, в большей или меньшей степени влияющих на ход процесса, заставляет задумываться о количестве статистической информации, необходимой для использования того или иного критерия стабилизации, и, конечно, о времени, необходимом для сбора и обработки этой информации. Если такая априорная информация получена и достаточно полна, то, как правило, используются результаты теории статистических решений [6,9,15,28-33,40], принцип максимума, динамическое программирование Г7,10,II,14,22,34], метода функций Ляпунова [35,36] теория игр [37] и т.д., если же нет, то применение адаптивных методов позволяет восполнить недостаток априорной информации.

Адаптивный подход, особенно быстро развивающийся в последнее время, использует также большое количество различных критериев, анализ и классификация некоторых рассмотрена в [25]. Так, адаптивный байесовский подход позволяет не прибегая к непосредственному восстановлению и минуя правило минимакса, обучить систему тому или иному байесову правилу, хотя и не избавлен от некоторого субъективизма при выборе априорного распределения, присущего различным его разновидностям. Минимаксный же риск, по существу, равен байесовскому риску, больше внимания уделено фи-дуциальному (по Фишеру) подходу и подходу, использующему метод несмещенных оценок. В работе [38] для синтеза эффективных алгоритмов оптимального управления производственными процессами при малом количестве наблюдений предлагаются свои методы, названные методами инвариантных "связок" с отличным от Фишеровского фидуциальным подходом. Немало работ посвящено использованию уравнения регрессии для определения оптимального управления, при этом нередко само уравнение регрессии восстанавливается адаптивными методами [39].

Выбор же критерия управления в общем случае очень сложная задача и решать ее приходится в каждом отдельном случае. Некоторые рекомендации на этот счет даются в [41], при этом предварительно следует рассматривать априорную информацию о процессе и объекте управления.

Введение и разработка [15,2] понятия и методов "дуального управления" определило развитие новых шагов, позволяющих одновременно изучать объект, т.е. собирать информацию об.объекте, обрабатывать ее, строя статистические характеристики,и управлять.

Адаптивные метода облегчают идентификацию объекта [2,9,11, 12,24,25,29,42-56], для чего нередко используется теория фильтрации [7,17,43,55], а в некоторых случаях позволяют применять принципы "дуального управления", восстанавливая описание объекта и управляя им одновременно [4,11-13,17,22,43,44,57-60]. I

В работах [17,61], применительно к объектам управления введен критерий максимума условной вероятности (в отличие от максимального правдоподобия [44,68] ) попадания выхода в заданный интервал, при известном состоянии на предыдущем шаге, критерий, известный ранее, в основном, примерительно к теории стрельбы [62]. Причем, постановка задачи в работе [61] дала начало и зародила соответствующие задачи, рассмотренные в главах 2 и 3.

Критерий максимума условной вероятности используется для определения оптимального "дуального" управления для нелинейных стохастических объектов в работе [221. На каздом шаге управления авторы получают управление с помощью двух раздельных процедур: I) процедуры управления, когда из функционального уравнения .динамического программирования строится оптимальная стратегия управления как функция условной плотности вероятности; 2) процедуры оценивания, когда функция условной плотности вероятности обновляется с помощью формулы Байеса при заданном оптимальном законе управления. Таким образом, получаемое оптимальное управление является дуальным и максимизирует функцию условной вероятности. Но при этом отмечаются трудности использования уравнения Байеса и функционального уравнения .динамического программирования, так как при увеличении числа шагов процедуры адаптации "количество запоминаемой информации становится чрезмерным даже для мощной ЦВМ".

Для стационарных случайных процессов этот же критерий используется в некоторых задачах, связанных с выходом за интервал задания наблюдаемых векторов состояния процесса и минимизацией площади выхода [21].

В некоторых вопросах критерий максимума условной вероятности может быть рассмотрен как частный случай экстремальных задач [7,14,17,34,63-67], а при достаточно большом времени наблюдения в задачах стабилизации с использованием этого критерия могут быть применены методы "локальной" оптимизации и асимптотического управления [69-73].

В связи с работами [74-76] возникла мысль об использовании метода потенциальных функций для идентификации степени достоверности, как функции от предыдущего значения выхода управляемого объекта и от управляющего воздействия с тем, чтобы затем определять управление, доставляющее максимум этой функции при каждом известном выходе на предыдущем шаге [61,77,78]. Развитию этого метода посвящены также работы [28,79,80] и настоящая работа.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Бендич, Нина Николаевна

Выводы совпадают с выводами в Приложении П, а что ка -сается значений 9*[0] , то их выбор должен быть обусловлен совпадением с каким-либо решением системы, описывающей модель (например (0,0,0)) и не должен быть совсем произвольным набором, это повлечет за собой существенные осложнения и может привести к потере сходимости.

Немалую роль играет и наличие первых пробных шагов (применение рандомизированной стратегии управления) в начале обучения * до использования синтезируемого, согласно (4.1.5), и в качестве "дуального управления". Если для сходимости алгоритма на некотором объекте при 50 случайных шагах в начале обучения понадобилось 360 коррекций, то при использовании "дуального управления" с первого шага для сходимости понадобилось 720 коррек -ций. Однако при большом числе шагов, сделанных согласно рандомизированной стратегии можно прийти к преждевременной сходи мости алгоритма и получению U не удовлетворяющему требованиям поддержания выхода в заданных пределах.

На рис. 5.10 приводятся результаты применения алгоритма (4.1.5) для идентификации управления системой, полученной из линейного дифференциального уравнения с запаздывающим аргументом x(tb6x(t-c0)-u+ir, у=х.

В качестве был взят 0Д±0,05, 1/-гауссовский шум с нулевым математическим ожиданием из (-0,25; 0,25), cO^L-T , где L -целое число, в данном случае L = 4, ЯГ = 0,5. Полученное управление, по существу должно учитывать не только положение выхода в момент {+«г , но и предвидеть положение его в момент t+cO + cT , т.е. обладать свойством прогнозировать на ( L-H ) шаг вперед. Существенных трудностей, по сравнению с предыдущими двумя объектами не встретилось, поэтому закончим на этом рассмотрение второго этапа.

Третий этап связан с алгоритмом вида (4.1.10), допускающим применение на реальном объекте. На первых шагах для нащупывания достаточно широкой окрестности экстремума был применен метод случайного поиска, а не просто управление, случайным образом выбранное, согласно некоторой плотности распределения, это диктуется возможностью реализации на работающем объекте, а не число . uLaiob

-OJ

Рис. 5.10 на модели. Как раз на этих начальных шагах задачу можно отнести к "плохим" задачам [100] , чувствительность оптимального решения достаточно велика, а методы отыскания его недостаточно грубы. Это вызвало дополнительные ограничения на вид алгоритма, который должен обеспечить "устойчивое" решение (см (4.3.1)), на полиномы разложения, обеспечивающие представимость функции управления в виде (3.1.6), их пришлось сменить на полиномы Чебы-шева и, наконец, на величину шума 1/ , выступающего в роли по -мехи при задании и воспроизведении управляющего воздействия 1Х*.

При работе с алгоритмом в качестве объекта управления была применена система, полученная из системы дифференциальных уравнений ос,

Хъ хг + 2x5W,5(u+tf), У = X,

V - по-прежнему гауссовский шум, его математическое ожидание принято равным нулю, среднеквадратическое отклонение «0,189. Интервал задания выбран

Y= (0,15 + 0,25; -0,35 * -0,25; 0,45 * 0,55), Начальные приближения UQ =0,45, йо=0,1,Уо =0,01. Модификация случайного поиска состоит в том, что на этом промежутке управление представлено в виде суммы и = Us + V , us - определяется на каждом шаге, согласно (4.1.10), - равномерно распределенная случайная величина с нулевым математическим ожиданием из интервала [-CL (X ] . Изменения GL происходят только в том s' s " случае, если была произведена коррекция коэффициентов разложе ния идентифицируемого U . Выход объекта и значения' управляю -щего воздействия во время случайного поиска показаны на рис.5.II. (компонента У, обозначена + , У5- о , управление и- обозначена 0). В качестве промежутка управления взят t =0,03, определенный также как и все остальные параметры алгоритма экспериментально.

После 30 коррекций по случайному поиску обновляется значение а * ему присваивается CL = и начинает работать алгоs 5 5 ритм (4.1.10), позволяющий применять "дуальное управление".На рис.5.12 показан выход объекта после 3000 шагов работы алгоритма (4.1.10).

Рис.5.13 иллюстрирует поведение выхода того же объекта после 6000 шагов обучения при задании у « (0,18 х 0,23; -0,33 * -0,28; 0,5 * 0,55) . Следует заметить, что на реальном объекте вместо первых шагов случайного поиска можно также применить сначала алгоритм (3.1.4) для определения примерного положения экстремума, для этого, как показал опыт, достаточно буквально нескольких коррекций. Положение экстремума, а не его значение, определяется очень быстро, этим можно объяснить тот факт, что управляющее воздействие, восстанавливаемое по (4.1.5) или по (4.1.10) вполне применимо для управления после нескольких первых шагов, а для сходимости алгоритма восстановления функции степени достоверности требуется гораздо большее число шагов (86 и 2200, соответственно, в экспериментах по идентификации уцравляющего воздействия одномерным объектом на втором этапе проведения экспериментов).

5.2. Процесс очистки рассола Проведение всех предыдущих опытов позволило, выбрав параметры, обеспечивающие наилучшую сходимость и устойчивый режим работы, приступить к идентификации уцравляющего воздействия для процесса очистки рассола.

В качестве модели процесса очистки принята следующая система дифференциальных уравнений " 51хГ № ^ (-0,65-0,09 (tt,+Uz) * 0,9V)+0,065 olx,(t) 2. < -gf-- 4oc, - ocf - 15хг + OfiH^v где X< (t) - нормированная концентрация фильтра (г/100л); qq^^ - нормированное содержание нерастворимых солей в выходном потоке (г/л); Х5 ("t) - нормированное содержание растворимых солей в выходном потоке (г/л); U((t) ~ нормированный расход раствора осадителя (и?/час); % (t) - нормированный расход раствора полиакрил амида (л/100 час); у ^ - гауссовский случайный шум на входе, учитывающий изменяющиеся концентрации входного потока, колебания нагрузки и условия образования и размеры ма1фоагрегатов твердой фазы;

Т - период управления С чао).

Эта модель отвечает всем требованиям, предъявляемым к объекту управления и описанным в разделе 2.1. Это марковский нелинейный объект третьего порядка с двумерным управляющим воздействием.

Оптимальное управляющее воздействие идентифицировалось, согласно алгоритму (4.1ДО) в виде м гц=ХХ ЧЛоЬ), 1=4,2. —

При этом предполагалось, что вид функции й [X] может быть описан полиномом третьего порядка.

На первом этапе считалось, что уравнение наблюдения имеет вид: у. =Х. , i = {Ь. (5.2.2)

Тогда класс попадания ограничивался неравенствами: la(Mxth£jf = 1ос51 <&5. (5.2.3)

Однако на каждом шаге управления измерять концентрацию фильтра практически невозможно, поэтому естественнее было рассматривать уравнение наблюдения как

УГХг > Уг = Х3> С5-2-4) а ограничения на класс попадания в виде

I yj = |xj<&2, fyj=lx5l<65 , (5.2.5) при этом координата состояния X, является наблюдаемой. Оказалось, что,цри прочих равных условиях, предоставленная "свобода" х, положительно влияет на быстроту и качество сходимости алгоритма (см.таблицу 5.1), поэтому в дальнейшем использовалось уравнение наблюдения (5.2.4) и ограничения (5.2.5) Объем обрабатываемых выборок 500, 6, = 0,02; 6, = 0,005; 6, = 0,005 #

I о О

6. ЗАКЛЮЧЕНИЕ

В работе ставится задача стабилизации выхода объекта по критерию максимума условной вероятности попадания в заданный интервал, при условии, что известно состояние на предыдущем шаге.

При известном описании, для линейных объектов а -го порядка с аддитивным шумом на входе приведены рекуррентные соотношения, позволяющие вычислить оптимальное, с точки зрения выбранного критерия, управление на каждом шаге. Для линейного объекта первого порядка и объекта сзапаздавающим аргументом определен аналитический вид управляющего воздействия.

Для стохастических объектов с запаздывающим аргументом разработан способ управления, использующий критерий максимума вероятности, сочетающий в себе способы стабилизации выхода с помощью пропорционального и интегрального регуляторов. Если известно математическое описание объекта, оно используется для отыскания точных значений коэффициентов регуляторов.

На примере линейных стохастических объектов с известным математическим описанием показано, что применение критерия максимума вероятности попадания выхода объекта в заданную область дает те же результаты, что и критерии среднего (в некоторых случаях) и удельного риска с квадратичной функцией потерь.

Предлагаемый нами критерий позволяет строить обучающиеся системы управления для объектов из достаточно широкого класса, если описание их частично или полностью неизвестно. При этом предлагается два способа. Первый способ связан с использованием метода потенциальных функций .для построения функции степени достоверности (условной вероятности) принадлежности выхода объекта заданному классу при известных значениях выхода на предыдущем шаге и управления и, после окончания построения, определением оптимального управляющего воздействия, доставляющего максимум идентифицированной функции и, в свою очередь, являющегося функцией выхода на предыдущем шаге.

Второй способ связан с идентификацией функции управления, доставляющей максимум неизвестной функции степени достоверности. Этот .способ опирается на идею Кифера-Вольфовица и метод потенциальных функций.

Рассмотрены возможности увеличения скорости сходимости алгоритма, связанного с первым способом,за счет использования априорной информации об объекте и распределении шума на входе для правильного выбора параметров и начальных приближений. Проведены соответствующие эксперименты.

Показано, что если интервал задания не известен заранее или может быть изменен в процессе работы, возможно построение функции степени достоверности попадания выхода в заданный класс, как функции от управляющего воздействия, выхода на предыдущем шаге и неизвестной середины интервала задания.

Доказана сходимость почти наверное алгоритма идентификации функции управления. Функция управления при этом ищется как функция от состояния на предыдущем шаге. Функция условной вероятности попадания выхода, в заданный интервал остается неизвестной.

Рассмотрены вопросы увеличения помехоустойчивости. Определен выбор полиномов разложения управляющего воздействия, сам вид управляющего воздействия и точность его представления в зависимости от шума, действующего на вход объекта.

Отмечаются недостатки предложенного алгоритма, связанные с трудностями применения его на действующем объекте, поэтому он предлагается для исследовательских работ, работ, связанных с использованием моделей производства. Приводятся соответствующие блок-схемы его использования с моделью.

Приводится алгоритм, позволяющий строить функцию управления в том случае, если неизвестная функция условной вероятности не является дифференцируемой и имеет разрывы.

И, наконец, приводится алгоритм, позволяющий идентифицировать управляющее воздействие на реальном объекте в темпе реального времени. Этот алгоритм позволяет без дополнительных построений, с минимальными априорными знаниями об объекте применять идентифицируемое управляющее воздействие в качестве "дуального". Приводятся структурные схемы дискретных систем, соответствующих этому алгоритму.

Проведены эксперименты по восстановлению функции степени достоверности и по управлению с помощью ее максимизации.

Проведены эксперименты по управлению сразу при помощи функции управления, определяемой как максимум неизвестной степени достоверности. Отмечается, что алгоритмы идентификации функции управления сходятся быстрее и раньше дают возможность управлять объектом.

Ряд экспериментов связан с увеличением скорости сходимости и выбором интервала управления Т .

Последние эксперименты посвящены применению алгоритма (4.1.10), позволяющего идентифицировать управляющее воздействие на реальном объекте. Отмечается, что дда рассмотренного класса объектов, его применение связано с большим временем сходимости, но позволяет управлять уже после первых десятков шагов.

На примере процесса очистки рассола при производстве хлора и каустика проведены эксперименты по управлению трехмерным нелинейным объектом с помощью идентификации двумерного управления, являющегося функцией от двух параметров состояния. Получено, что за 40500 шагов управления происходит увеличение вероятности попадания выхода объекта в заданный класс с 0,5966 до 0,7459.

На очереди рассмотрение влияния выбора размерности полиномов разложения и применение на входе случайного воздействия с несимметричной плотностью распределения.

Аналитические выражения для вычисления оптимального управления, полученные в работе, позволяют синтезировать регуляторы различных типов, стабилизирующие выход объекта в смысле предложенного критерия.

Предложен подход к анализу систем с запаздыванием на основе сравнения величин запаздывания аргумента и периода управления.

Алгоритмы, предложенные в работе, могут найти применение в системах управления промышленными объектами с неполным описанием на базе УВМ (системы НЦУ) в качестве составной части математического обеспечения (Приложение ТУ).

Список литературы диссертационного исследования кандидат технических наук Бендич, Нина Николаевна, 1984 год

1. Аоки М. Оптимизация стохастических систем. М.: Наука,1977, 424 с.

2. Бондаренко В.А. ,Лихтарников А.Л., Фрадков А.Л. Синтез адаптивной системы стабилизации линейного объекта с распреде -ленными параметрами. А и Т, 1979, № 12, с.95-103.

3. Живоглядов В.П. Адаптация в автоматизированных системах управления технологическими процессами. Фрунзе: Илим, 1974.227с.

4. Катковник В.Я., Кульчицкий О.Ю. Возможность применения методов типа стохастической аппроксимации для адаптивной стабилизации дискретной линейной динамической системы. А и Т, 1976,9, с.113-123.

5. Кротов В.Ф., 1Урман В.И. Методы и задачи оптимального управления. М.: Наука, 1973, 446 с.

6. Фильтрация и стохастическое управление в динамических системах / Под ред. Леондеса К.Т./ М.: Мир, 1980 . 407с.

7. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука, 1975. 526 с.

8. Острем К. Введение в стохастическую теорию управления. М.: Мир, 1973, 321 с.

9. Пропой А.И. Элементы теории оптимальных дискретных про -цессов. М.: Наука, 1973. 255 с.

10. Саридис Д. Самоорганизующиеся стохастические системыуправления. М.: Наука, 1980. 400 с.

11. Срагович В.Г. Адаптивное управление. М.: Наука, 1981. 382 с.

12. Срагович В.Г. Теория адаптивных систем. М.: Наука, 1976. 320 с.

13. Ту Ю. Современная теория управления. М.: Машиностроение, 197I. 472 с.

14. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 623 с.

15. Фрадков А.Л. Синтез адаптивной системы стабилизации линейного динамического объекта. А и Т, 1974, № 12, с.96-103.

16. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968. 399.с.

17. Цыпкин Я.З. Основы теории обучающихся систем. М.:Наука, 1970. 252 с.

18. Деруссо П., Рой Р., Клоуз Ч. Пространство состояний в теории управления. М.: Наука, 1970. 620 с.

19. Кендалл М, Дж., Стьюарт А. Теория распределений. М.: Наука, 1966. 587 с.

20. Крамер Г., Лидбеттер М. Стационарные случайные процессы. М.: Мир, 1969. 398 с.

21. Tse 8., baz-Shalom j.,Meit L.Wide-Sense Adaptive dual Contvoi jsoz ?/onlinea% Sioohastic Systems. IEEE Tmns. Automatic ConUol, <973, A/18, tr 2., p 98 408 .

22. Аксенов Г.С., Фомин В.Н. Об адаптивной стабилизации линейного объекта в условиях сильной априорной неопределенности.-В кн: Вопросы кибернетики. Адаптивные системы. М.: НС по кибернетике. АН СССР, 1976, с. 90-93.

23. Mcoletti В., Mdtiani L. Optimization oj> поп -unijfovmly Sampled disczete systems. AutoniaticcL,197iv.7,r/6,p. 747 - 753.

24. Radihe M.f MetWen ztut cUjnamisch&n Optimiezuncj/ industti&Uw Tvozesse. Messen. Sleuevn. R^eln, 1971, 14, л/7, p. 256 - 265.

25. Бендич H.H., Гитерман Э.М. Алгоритмы управления дискретными объектами с запаздыванием. Техническая и экономическая информация. Автоматизация химических производств. М.: НИИТЭХИМ, 1976, № 3, с. 3-8.

26. Дейч A.M. Методы идентификации динамических объектов. М.: Энергия, 1979. 240 с.

27. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных задачах. М.: Наука, 1975. 319 с.

28. Репин В.Г., Тартаковский Г.П. Статистический синтез при априорной неопределенности и адаптации информационных систем. М.: Советское радио, 1977. 432 с.

29. Фрадков А.Л. Схема скоростного градиента и ее применение в задачах адаптивного управления. А и Т, 1979, № 9, с. 90-101.

30. Крамер Г. Математические методы статистики. М.: Мир, 1975, 648 с.

31. Петров Б.Н., Рудковский В.Ю., Крутова И.Н., Земляков С.Д. Принципы построения и проектирования самонастраивающихся систем управления. М.: Машиностроение, 1972. 260 с.

32. Аксенов Г.С., Фомин В.Н. Синтез адаптивного управления с помощью вырожденной функции Ляпунова. Вестн.Ленинград, ун-та, 1979, № 19, с. 5- 8.

33. Беллман Р. Процессы регулирования с адаптацией. М.: Изд-во иностр. лит, 1962. 369 с.

34. Беленький В.З., Волконский В.А., Иванков С.А., Поманс-кий А.Б., Шапиро А.Д. Итеративные методы в теории игр и программировании. М.: Наука, 1974. 239 с.

35. Божанов Э.С. Применение метода стохастической аппроксимации для восстановления характеристик объектов. А и Т, 1967, № 6, с.95-103.

36. Кондратьев В.В., Савельев В.П., Шорохов О.С. Оптимиза -ция дискретного управления методом последовательных приближе -ний. А и Т, 1980, В 6, с.48-57.

37. Поляк Б. Т. Учет априорной информации в адаптивных алгоритмах. В кн.: Тезисы докладов, представленных на УП Всесоюзном совещании по проблемам управления. М.: ИПУ, 1977, с.87-89.

38. Аведьян Э.Д., Цыпкин Я.З. Обобщенный алгоритм Качмажа. -А и Т, 1979, I, с.72-78.

39. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем управления. М.: Наука, 1981,216 с.

40. Ли Р. Оптимальные оценки, определение характеристик и управление. М.: Наука, 1966. 176 с.

41. Медич Дж. Статистически оптимальные линейные оценки и управление. М.: Энергия, 1973. 440 с.

42. Невельсон М.Б., Хасьминский Р.З. Стохастическая щщрокси-мация и рекуррентное оценивание. М.: Наука, 1972. 304 с.

43. Познлк А. С. Сходимость алгоритмов стохастической аппроксимации при идентификации параметров динамических объектов.

44. А и Т, 1979, № 8, с.151-154.

45. Поляк Б.Т., Цыжин Я.З. Помехоустойчивая идентификация.- В кн. ЗУ симпозиум ИФАК. Идентификация и оценка параметров систем. чЛ Тбилиси: Мецниереба, 1976, 516 с.

46. Поляк Б.Т., Цыпкин Я.З. Адаптивные алгоритмы оценивания (сходимость, оптимальность, стабильность). А и Т, 1979, № 3, с.71-84.

47. Сейдж Э.П., Мелса Дж.Л. Идентификация систем управления.- М.: Наука, 1974. 246 с.

48. Цыпкин Я.З. Синтез оптимальной настраиваемой модели в задачах идентификации. А и Т, 1981, № 12, с.62-77.

49. Якубович В.А. К теории адаптивных систем. Докл. АН СССР, 1968, т.183, № 3, с.518-521.

50. В&ъ-Shalom i., Jse £. Dual S^fcect, Cwtainty Equivalence and Separation in Siocftasttc Contzot. -IlrEE bans. Automatic ConUoi, 1974, v. AM9, a!5, p. 494-512.

51. Woketoch L., Кокг Я. An Experimental dettzmifiation oj deffwe-ntial Equations lo Desce.i&e Simple, pontine,at

52. Systems.-Points JACC, 1966, p. 616 625.

53. Ijuncj, L A$ij*nlotic Befiavioica of the Extended Kalman Eiiitt as a Patametet Ssttmctto-a fyet Linear Systems.-IEEE Tmns. Auiom. Cont, 1979, v 24, л/i, p. 36 -50.

54. Salidis Richer 3). Analog Methods рог On tine System Jdentification Usinfy Noisy Measurement.- Simulation, 1968,^11, v. 5,p. 244-248.

55. Винер H. Кибернетика или управление и связь в животном и машине. М.: Советское радио, 1968. 326 с.

56. Кунцевич В.М., Лычак М.М. Об оптимальном и адаптивном управлении динамическими объектами в условиях неопределенности.- А и Т, 1979, № I, с.79-88.

57. Цыпкин Я.З. Оптимизация в условиях неопределенности. -Докл. АН ССОР,1976, т.228, № 6, с.1306-1309.

58. Цыпкин Я.З. Адаптивные алгоритмы оптимизации при априорной неопределенности. А и Т, 1979, 1,6, с.94-108.

59. Поляк Б.Т. Один общий метод решения экстремальных задач.- Докл. АН СССР, 1967, т.74, № I, с.33-36.

60. Fabian Stochastic, appzoxitnaiion oft constrained iniHi<ma. hansaction 4-ih Pmcj,ae jn^oim. Theottj-j ,jStaUst. Deais. Funct, Ran don Рго Pm^ue: /067, p. 277- 290.

61. Кельманс Г.К., Позняк А.С., Чернщер А.В. Алгоритмы "локальной" оптимизации в задачах асимптотического управления нелинейными динамическими объектами. А и Т, 1977, № II, с.73-88.

62. Кельманс Г.К., Позняк А.С. Об асимптотическом управлении динамическими системами с помощью алгоритмов "локальной" оптимизации. Техническая кибернетика, 1977, № 5, с.36-43.

63. Кельманс Г.К., Позняк А.С., Черницер А.В. Адаптивное управление динамическими системами. В кн.: Тезисы докладов на УШ Всесоюзном совещании по Проблемам управления. Таллин: ИЛУ, 1980, с.226-268.

64. Кы$кгг И.. Stochastic approximation aic^oiiihms jj-оъ the local aptimiKatiovi oj* functions vfitk nomininue stationary points. IEEE Ttftns. Automat. Contvot, /972, V5, tf.17, p. 646-654.

65. Ljuncj, I, Convezстепсе o^ an adaptive fritlev atcj/O-tithnb.- Jntev. Conizot., 1977, ir,27,//$, p. 673'695.

66. Айзерман M.A., Браверман Э.М., Розоноэр Л.И. Вероятностная задача об обучении автоматов распознаванию классов и метод потенциальных функций. А и Т, 1964, JS 9, с.1307-1323.

67. Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин. М.: Наука, 1970, 384 с.

68. Литванов-Б.М. Экстремальный подход к определению условий сходимости алгоритмов метода потенциальных функций. А и Т, 1969, Ш 9, с.98-108.

69. Бендич Н.Н. Об одном алгоритме адаптивной стабилизации.-Автометрия. Новосибирск: Наука, 1980, $ 3, с.121-123.

70. Бендич Н.Н., Кондратьев В.В. Один подход к максимизации функции вероятности в задачах стабилизации. Приближенные методы решений операторных уравнений и их приложения. Иркутск: АН СССР СЭИ, 1982, $ 12, с.14-20.

71. Бендич А.Н., Бендич Н.Н., Гитерман Э.М. Эквивалентность двух критериев управления .для одного класса объектов. Автоматизация химических производств. Техническая и экономическая информация. М.: НИИТЭХИМ, 1972, JG 3, с.30-37.

72. Технический отчет п/я В-8855. Создание АСУ ТП производства хлора и каустика на предприятии п/я Г-4753. Ангарск: 1980.170с.

73. Беллман Р. Введение в. теорию матриц. М.: Наука, 1969. 367 с.

74. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1967. 575 с.

75. Градштейн И.С., Рыжик И.М. Таблицы интегралов, суш , рядов и произведений. М.: Наука, 1971. 1108 с.

76. Беллман р.} Кук К. Дифференциально-разностные уравнения. М.: Мир, 1967. 548 с.

77. Вазан М. Стохастическая аппроксимация. М.: Мир, 1972. 296 с.

78. Поляк Б.Т. Сходимость и скорость сходимости итеративных стохастических алгоритмов. А и Т., 1967, № 12, с.83-94; 1977, № 4, с.101-107.

79. Fabian if. Stocfiasiic appzoximation method.-- Ckekosiov&L Maik. I., 1960, v. 2, p 126 459.90. liivakov В. M. On a c,tass oj* HoUins Monvo p-eoceolu^es. - l-nfrovm. Set, 1973, v. 6, /Vi,p. 33-48.

80. Поляк Б.Т., Цыпкин Я.З. Псевдоградиентные алгоритмы адаптации и обучения. А и Т, 1973, № 3, с.45-69.

81. Бендич Н.Н., Корнев В.М. О плотности собственных значений в задачах устойчивости тонких упругих оболочек. Прикладная математика и механика. М.: АН СССР, 1971, № 2, т.35, с.364-368.

82. Каше де Ферье Ж., Кемпбелл Р., Фогель Т. Функции мате -матической физики. М.: Физматгиз.,1963. 104 с.

83. Красовский Н.Н. Некоторые задачи устойчивости движения. М.: Физматгиз, 1959. 211 с.

84. Льгонг Л. Асимптотические дисперсии алгоритмов стохасти -ческой аппроксимации. А и Т, 1974, № 9, с.178-182.

85. Поляк Б.Т., Цыпкин Я.З. Робастные псевдоградиентные алгоритмы адаптации. А и Т, 1980, № 10, с.91-97.

86. Hu&ez P. f.fto&nst estimation of, a Hocation pavarnetez, -Avn.Math. Statist., 1964, <r35, лМ,p. 73-Ю-1.

87. Гшгьбо Е.П., Челпанов И.Б. Обработка сигналов на основе упорядоченного выбора. М.: Советское радио, 1975. 344 с.

88. Гильбо Е.П., Челпанов И.Б., Шевляков Г.Л. Робастное приближение функций в условиях неопределенности. А и Т, 1979,4, с.51-60.

89. Цыпкин Я.З. О некоторых свойствах случайного поиска. -А и Т, 1977, № II, с.89-94.

90. Bciv Ska torn J., fteishwin. S. В. Applicability ojf ctd&piive сontwl to ъчоХ pvofctzms-btends and opinios.-Auiotnaiica, 1977, tr. 13, a/4, p. 407-40 8.

91. Воронов А.А. Устойчивость, управляемость, наблюдаемость. М.: Наука, 1979. 335 с.

92. Кушнер Г.Дж. Стохастическая устойчивость и управление. М.: Мир, 1969. 200 с.

93. Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983. 384 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.