Управление группами наблюдателей на основе мультиагентного подхода тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат наук Ерофеева Виктория Александровна

  • Ерофеева Виктория Александровна
  • кандидат науккандидат наук
  • 2018, ФГБОУ ВО «Санкт-Петербургский государственный университет»
  • Специальность ВАК РФ01.01.09
  • Количество страниц 86
Ерофеева Виктория Александровна. Управление группами наблюдателей на основе мультиагентного подхода: дис. кандидат наук: 01.01.09 - Дискретная математика и математическая кибернетика. ФГБОУ ВО «Санкт-Петербургский государственный университет». 2018. 86 с.

Оглавление диссертации кандидат наук Ерофеева Виктория Александровна

Введение

1 Оценивание параметров движения объектов на основе муль-тиагентного подхода

1.1 Оценивание параметров движения объектов на основе последовательности наблюдений

1.1.1 Калмановская фильтрация

1.1.2 Стохастическая аппроксимация

1.1.3 Линейные матричные неравенства

1.2 Мультиагентный подход

1.3 Управление группами агентов в динамической среде

2 Оптимизация распределения объектов наблюдения между наблюдателями и оценивание параметров движения группы объектов на основе мультиагентного подхода

2.1 Постановка задачи распределенного отслеживания траекторий движущихся объектов

2.1.1 Модель наблюдений

2.1.2 Оптимизация нестационарного функционала среднего риска

2.1.3 Распределенная оптимизация

2.1.4 Доверительные эллипсоиды

2.2 Оптимизация распределения объектов между наблюдателями на основе решения системы линейных матричных неравенств

2.3 Оценивание состояний движущихся объектов

2.3.1 Циклический подход

2.3.2 Верхняя граница среднеквадратической ошибки оценивания по циклическому алгоритму

2.4 Мультиагентный алгоритм отслеживания изменений параметров с применением циклического подхода

3 Имитационное моделирование

3.1 Модели движения объектов

3.2 Исследование работы алгоритма оптимизации распределения объектов между наблюдателями на основе решения системы линейных матричных неравенств

3.3 Оценивание траекторий движущихся объектов с помощью алгоритма циклической стохастической аппроксимации

Заключение

Литература

Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Управление группами наблюдателей на основе мультиагентного подхода»

Введение

В соответствии со Стратегией научно-технологического развития Российской Федерации в ближайшие 10-15 лет одним из важнейших приоритетов будет «переход к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и искусственного интеллекта». Для решения указанных задач, создания соответствующих методов и технологий требуется выполнение опережающих исследований, к числу которых можно отнести управление группами роботизированных устройств, функционирующими в динамической среде. На сегодняшний день получили широкое распространение роботизированные системы, состоящие из нескольких устройств, способных реагировать на изменения во внешней среде, самостроятельно обрабатывать данные и коммуници-ровать с другими устройствами. Устройства, обладающие описанными свойствами, будем называть в работе наблюдателями.

Группа наблюдателей со значительно большей гибкостью, адаптируемостью и надежностью может совместно выполнять задачи, которые очень сложны для одного наблюдателя или их небольшого количества. Увеличение количества наблюдателей предоставляет новые возможности по использованию роботизированных систем для сложных, комплексных задач, но при этом возникает проблема распределенного управления группой, в частности, в условиях неопределенностей. Это приводит к необходимости создания новых передовых цифровых технологий управления. При этом повышаются требования по обеспечению устойчивости их функционирования, так как подобные технологии востребованы в жизненно важных областях: распределенные энергетические системы, беспилотное управление автомобилями и летательными аппаратами, мониторинг территорий, дорожной сети и трубопроводов, поисково-спасательные операции и т. п.

Смещение фокуса исследований со специализированных централизо-

ванных комплексов к системам с децентрализацией можно проследить до работ по распределенным вычислениям Н. А. Линч (N. A. Lynch) [73], теории принятия оптимальных управленческих решений М. Х. ДеГру-та (M. H. DeGroot) [50], коллективного поведения Т. Висека (T. Vicsek) [104,105], распределенным методам принятия решений Дж. Н. Тситсик-лиса (J. N. Tsitsiklis) [102,103] в области теории управления. В работах А. Джадбабаи (A. Jadbabaie), А. С. Морса (A.S. Morse) [63], Р. М. Мюррея (R. M. Murray) [53,81], Р. Олфати-Сабера (R. Olfati-Saber) [81], В. Рена (W. Ren) [88,89], Р. В. Берда (R. W. Beard) [88,89], Р. П. Агаева [35], П. Ю. Чеботарева [35], А. Л. Петросяна [24,25], В. В. Захарова [101], Ф. Булло (F. Bullo) [44], Ф. Л. Льюиса (F. L. Lewis) [74] и других заложены фундаментальные принципы построения распределенных алгоритмов муль-тиагентной (многоагентной) координации и управления движением, обсуждаются сферы практического применения разработанных подходов к организации коллективного поведения наблюдателей (роботов, агентов).

Организация коллективного поведения групп наблюдателей включает в себя ряд задач, при этом распределение заданий в группе является неотъемлемой частью функционирования роботизированной системы. С практической точки зрения наибольшую целесообразность находит использование группы для сложных, комбинированных задач, подразумевающих возможность декомпозиции на подзадачи. В таком случае повышение эффективности выполнения общей задачи достигается путем оптимизации разделения наблюдателей на подгруппы, назначаемые определенным подзадачам. Однако, в общем виде проблемы оптимизации подобного рода относятся к классу трудоемких переборных задач, сложность которых повышается при увеличении размера группы наблюдателей и количества подзадач.

В настоящее время активно развиваются методы формирования и построения сложных адаптивных систем на основе мультиагентных технологий. В отличие от «традиционного подхода», в котором основным звеном системы является один «вычислитель», называемый также центральный узел, рассматривается огромное множество наборов распре-

деленных в пространстве автономных агентов. Различные практические примеры показывают, что для решения многих задач достаточно предположить наличие возможностей только локального взаимодействия агентов. В этом случае каждый агент может взаимодействовать не со всеми участниками группы, а только с несколькими, называемыми соседями. При этом совместные действия агентов способствуют достижению общих для системы целей. В таких условиях при достаточно общих предположениях множество агентов кластеризуется в том смысле, что большие группы агентов показывают одинаковое поведение. Это дает возможность замены решения исходной задачи в пространстве большой размерности на исследования многих простых однотипных задач и одной общей, но существенно упрощенной задачи в пространстве с размерностью пропорциональной получившемуся количеству кластеров. Такой подход детально изучался в работах И. В. Бычкова [6], В. И. Городецкого [14], П. О. Скобелева [14,90], Г. А. Ржевского [90], М. Вулдриджа (М. 1МооЫпа§е) [107], И. А. Каляева [23] и др.

Несмотря на наличие очевидных преимуществ использования муль-тиагентного управления для решения сложных, комплексных задач, такой подход несет в себе некоторые трудности. Во-первых, мультиагент-ные системы в значительной степени опираются на возможность взаимодействия между агентами. Коммуникации сопряжены с рядом неопределенностей, такими как: ограничения пропускной способности каналов данных, помехи при передачи данных, сетевые задержки, обрывы связей между агентами и др. Во-вторых, в таких системах зачастую применяют «простые» устройства, которые обладают меньшими вычислительными ресурсами и требуют повышенной энергоэффективности. Вследствие этого требуется разработка ресурсо-эффективных алгоритмов управления, что актуализирует направление диссертационного исследования. В работах А. Недич (А. Ке^е) [76,77], Р. Олфати-Сабера (Я. ОКа^-БаЬег) [82], А. В. Проскурникова [54,83,84], А. С. Матвеева [83] представлены результаты исследования алгоритмов распределенной оптимизации и консенсусного управления. Для задачи достижения кон-

сенсуса на графах при наличии зашумленных измерений о состояниях соседей в работах М. Хуанга (M. Huang) [62], М. Дж. Вайнрайта (M. J. Wainwright) [91], Д. Вергадоса (Vergados D.J.) с соавторами [106], А. Л. Фрадкова и Н. О. Амелиной [1,39] рассматривалось применение алгоритмов типа стохастической аппроксимации. Этот тип алгоритмов является одним из важнейших классов среди подходов к решению задач оптимизации с неопределенностями. Сегодня стохастическая аппроксимация имеет широкий спектр приложений в таких областях, как адаптивная обработка сигналов, адаптивное размещение ресурсов в коммуникационной сети, идентификация систем, адаптивное управление и других. В работах Б. Т. Поляка [26], Дж. С. Спалла (J. C. Spall) [94,95], В. С. Бор-кара (V. S. Borkar) [40], А. Б. Цыбакова [26], Х. Кушнера (H. Kushner) и Г. Г. Ина (G. G. Yin) [64] стохастическая аппроксимация используется с убывающими со временем до нуля размерами шагов. Сейчас возрастает использование алгоритмов стохастической аппроксимации для оптимизации нестационарных функционалов качества (изменяющихся со временем). В таких задачах отслеживания изменений параметров часто используют достаточно малый, но постоянный размер шага. Д. П. Деревицкий и А. Л. Фрадков в [15,16] при анализе динамики алгоритмов адаптации, основанном на построении приближенных усредненных моделей, обосновали возможность использования алгоритмов стохастической аппроксимации с неубывающим до нуля размером шага. Позже исследование оптимизации нестационарных функционалов рассматривалось в работах Н. О. Амелиной [39,55], Н. О. Граничина [7,8,55], Дж. С. Спалла (J. C. Spall) [114], В. С. Боркара (V. S. Borkar) [40].

В ряде работ сокращение сложности трудоемких переборных задач, которой является оптимизации разделения наблюдателей на подгруппы, предложено построение субоптимального разреженного решения. Новый математический аппарат, связанный с так называемыми матричными линейными неравенствами (англ. Linear Matrix Inequality, LMI), возник в 60-е годы в теории управления и описывался в работах В. А. Якубовича [36, 37]. Позже оказалось, что линейные матричные неравенства

представляют собой очень общий метод анализа и синтеза линейных систем, детально описанный в работах С. Бойда (S. Boyd) с соавторами [45,46]. Появление эффективных программ решения линейных матичных неравенств сделало этот аппарат весьма эффективным с вычислительной точки зрения. Дальнейшее развитие теория анализа систем на основе матричных линейных неравенств получила в работах Дж. Ка-лафиоре (G. Calafiore) [49], Б. Т. Поляка [22,27-31,49,85], П. С. Щербакова [27-31,85], М. В. Хлебникова [22,29-31,85], Д. В. Баландина [4,5], М. М. Когана [4, 5] и др.

Обозначенные проблемы и тенденции подтверждают актуальность темы диссертационного исследования.

Цель работы — разработка алгоритмов коллективного поведения групп наблюдателей при движении и распределении объектов слежения в условиях наличия неопределенностей внешней среды, получения измерений с помехами и изменения состояния наблюдаемых объектов. Для достижения этой цели были поставлены и решены следующие задачи:

1) исследовать возможность оптимизации распределения целей между наблюдателями на основе мультиагентного подхода;

2) исследовать свойства оценок циклического алгоритма поисковой стохастической аппроксимации для отслеживания изменений неизвестных параметров системы;

3) исследовать возможность применимости циклического алгоритма поисковой стохастической аппроксимации для мультиагентного оценивания состояний движущихся объектов на основе измерений, получаемых группой наблюдателей.

Методы исследования. В диссертации используются методы теорий оценивания, оптимизации, управления, графов, вероятностей и математической статистики; применяются методы стохастической аппроксимации,

рандомизированные алгоритмы, линейные матричные неравенства, имитационное моделирование.

Основные результаты. В ходе выполнения работы получены следующие научные результаты:

1) предложен и обоснован метод оптимизации распределения объектов слежения между наблюдателями, основанный на решении системы линейных матричных неравенств и позволяющий использовать мультиагентный подход в процессе наблюдения;

2) предложено обобщение метода циклической поисковой стохастической аппроксимации для отслеживания изменений неизвестных параметров системы на случай оптимизации нестационарного функционала, получена асимптотическая верхняя граница среднеквад-ратической невязки оценок предложенного метода;

3) разработан метод управления группами наблюдателей с использованием мультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации, получена асимптотическая верхняя граница сред-неквадратической невязки оценок для распределенного циклического алгоритма.

Научная новизна. Все основные научные результаты диссертации являются новыми.

Теоретическая ценность и практическая значимость. Теоретическая ценность результатов заключается в разработке и обосновании метода оптимизации распределения объектов слежения между наблюдателями, основанного на решении системы линейных матричных неравенств и позволяющего использовать мультиагентный подход в процессе наблюдения; в обобщении метода циклической поисковой стохастической аппроксимации для отслеживания изменений неизвестных параметров системы на случай оптимизации нестационарного функционала среднего риска,

установлении условий его работоспособности. Методы оптимизации распределения объектов слежения между наблюдателями и циклической стохастической аппроксимации легли в основу предложенного метода управления группами наблюдателей с использованием мультиагентно-го оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации, для которого при определенных условиях получены среднеквадратические оценки качества.

Предложенные методы и подходы могут использоваться при решения ряда практических задач. В частности, для отслеживания перемещения объектов в космическом пространстве распределенной сетью малых спутников, исследования перемещений животных в заповедниках с помощью беспилотных летательных аппаратов, мониторинга окружающей обстановки при движении автономных беспилотных автомобилей с помощью группы установленных на них сенсоров и др.

Апробация работы. Результаты диссертации докладывались на семинарах кафедр системного программирования и теоретической кибернетики математико-механического факультета СПбГУ, на конференции IFAC Conference on Modelling, Identification and Control of Nonlinear Systems (MICNON'15) (June 24-26, 2015, Saint Petersburg, Russia), на Восьмой традиционной всероссийской молодежной летней школе «Управление, информация и оптимизация» (пос. Репино, г. Санкт-Петербург, Россия, 14-19 июня, 2016), на конференциях Workshop on Quantum Informatics and Applications in Economics and Finance (December, 22, International Research Laboratory (Fin Q Lab) University ITMO, St. Petersburg, Russia), Суперкомпьютерные дни в России (Москва, Россия, 26-27 сентября, 2016), International Symposium of New Techniques in Medical Diagnosis and Treatment (June 1-3, 2017, Wuhan, China), на конференции молодых ученых «Навигация и управление движением» (Санкт-Петербург, Россия, 14-17 марта, 2017).

Результаты диссертации были использованы в работах по грантам

ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» 6.56.1224.2014 «Разработка мультиагентной технологии управления распределенными гетерогенными вычислительными ресурсами для адаптивной балансировки загрузки устройств в реальном времени при решении комплексных вычислительных задач», РФФИ 16-07-00890 «Рандомизированные алгоритмы в автоматическом управлении и при извлечении знаний», РФФИ 17-51-53053 «Разработка методов получения суперразрешения цифровых моделей поверхности на основе сверточных нейронных сетей», РНФ 16-19-00057 «Адаптивное управление с прогнозирующими моделями при переменной структуре пространства состояний с приложением к системам сетевого управления движением и автоматизации медицинского оборудования». Проект «Разработка программно-аппаратного комплекса для согласованного сетевого управления самоорганизующейся группой беспилотных летательных аппаратов», включающий результаты исследования, отмечен дипломом победителя молодежного научно-инновационного конкурса (УМНИК-2016). Проект «Разработка адаптивного децентрализованного алгоритма планирования маршрута группой беспилотных летательных аппаратов при выполнении задач мониторинга» в 2017 году отмечен дипломом победителя конкурса для студентов и аспирантов вузов, отраслевых академических институтов, расположенных на территории Санкт-Петербурга.

Публикация результатов. Основные результаты исследований отражены в работах [3,17-21,38,52]. Соискателем опубликовано 8 научных работ, из которых одна опубликована в издании, индексируемом в базе данных Scopus, и одна в журнале, входящем в перечень рецензируемых научных журналов, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук.

Работы [3, 17, 38, 52] написаны в соавторстве. В работе [17] В. А. Ерофеевой принадлежит доказательство теоремы и результаты имитационного моделирования, соавторам — общая постановка задачи, выбор методов решения. В [38] В. А. Ерофеевой принадлежит модификация

протокола локального голосования для задачи управления движением группы динамических объектов (роботов, агентов), соавторам — общая постановка задачи, выбор методов решения. В [52] В. А. Ерофеевой принадлежит описание подхода к управлению движением группы роботов в динамической среде, результаты имитационного моделирования, соавторам — общая постановка задачи, выбор методов решения. В [3] В. А. Ерофеевой принадлежит общая постановка задачи, анализ методов машинного обучения, результаты экспериментов, соавторам - архитектура программного обеспечения.

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы, включающего 115 источников. Текст занимает 86 страниц, содержит 8 рисунков и 2 таблицы.

Краткое содержание работы

Во введении обосновывается актуальность диссертационной работы, формулируется цель, ставятся задачи исследования и кратко излагаются основные результаты.

В первой главе приводится описание проблемы оценивания параметров движения объектов, сопровождаемое обзором литературы по теме исследования. В разделе 1.1 ставится задача оценивания параметров движения объектов по последовательности наблюдений и отмечается, что при увеличении общего количества наблюдателей и количества подзадач проблема оптимизации подобного рода в общем виде переходит в класс трудоемких переборных задач. Далее следуют три подраздела, в которых описываются методы из теории оценивания и управления, которые могут быть применены для решения поставленной задачи. В подразделе 1.1.1 описывается ставший уже классическим подход на основе применения фильтра Калмана. Там же отмечается, что при увеличении количества наблюдателей и объектов отслеживания использование Кал-мановской фильтрации приводит к повышению требований к вычислительным ресурсам отслеживающей системы. Кроме того, для получения оптимальной оценки по фильтру Калмана требуется выполнение предпо-

ложения о случайности шумов (помех в наблюдениях). В литературе при ограниченных, а в остальном произвольных помехах активно исследуются методы поисковой стохастической аппроксимации и линейных матричных неравенств. Подраздел 1.1.2 посвящен описанию как существующих достижений в области оценивания неизвестных параметров системы на основе алгоритмов стохастической аппроксимации, так и текущих тенденций в развитии этих методов. В подразделе 1.1.3 приводятся основные понятия и свойства техники линейных матричных неравенств, описывается задача фильтрации в дискретном случае и приводится теорема об оптимальном фильтре, далее вводится понятие аналитического центра линейного матричного неравенства, на идее которого строится решение задачи оптимизации распределения объектов между наблюдателями во второй главе диссертации. Подраздел заканчивается обсуждением возможностей применения ^-оптимизации для получения субоптимального разреженного решения в сложных переборных задачах. В разделе 1.2 описываются особенности построения систем на основе мультиагентного подхода. В разделе 1.3 рассматривается пример практического приложения.

Во второй главе уточняется постановка задачи оценивания параметров движения объектов группой наблюдетелей, формулируются и доказываются основные результаты диссертационного исследования. В подразделе 2.1.1 вводится конкретная модель наблюдений (измерений), далее в подразделе 2.1.2 формулируется задача оптимизации нестационарного функционала среднего риска при линейных ограничениях, которая распространяется на случай распределенной оптимизации в подразделе 2.1.3. Кроме того, в подраделе 2.1.3 приводятся ограничения на функционирование сети наблюдателей, которые мотивированы с практической стороны. В подразделе 2.1.4 вводится понятие доверительного эллипсоида и рассматриваются его свойства применительно к решаемой задаче, формулируется функционал качества, учитывающий введенные ограничения на функционирование сети. Раздел 2.2 посвящен решению задачи оптимизации распределения объектов между наблюдателями с

применением техники линейных матричных неравенств, формулируется Теорема 2, обосновывающая получаемое решение. В разделе 2.3 рассматривается модификация поискового алгоритма стохастической аппроксимации с постоянным размером шага и линейными ограничениями на основе циклического подхода, формулируются основные предположения и доказывается Теорема 3, отражающая среднеквадратическое качество оценок, получаемых по предложенному алгоритму. В разделе 2.4 предлагается метод управления группами наблюдателей с использованием мультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации, состоящий из двух этапов: сначала производится распределение объектов между наблюдателями с применением техники линейных матричных неравенств, далее предполагается, что полученное решение остается неизменным на некотором временном интервале (не очень малом), т. е. достаточно долго субоптимальная структура остается неизменной, при выполнении этого предположения второй этап заключается в применении алгоритма циклической стохастической аппроксимации, для которого формулируется и доказывается Теорема 4.

В третьей главе приводятся результаты имитационного моделирования, иллюстрирующие работу предложенных методов и подходов. В разделе 3.1 описываются используемые при имитационном моделировании модели движения объектов наблюдения. В разделе 3.2 приводятся результаты решения модельной задачи оптимизации распределения объектов между наблюдателями, на основе метода из раздела 2.2, а также обсуждается их возможное дальнейшее применение при решении задачи оценивания траекторий. В разделе 3.3 демонстрируются результаты применения алгоритма циклической поисковой стохастической аппроксимации для оценивания траекторий движущихся объектов при различных значениях ограничений на функционирование сети наблюдателей.

В заключении формулируются основные результаты диссертации.

Глава 1

Оценивание параметров движения объектов на основе мультиагентного подхода

Задача оценивания параметров движения объектов встечается повсеместно: геоинформационные системы, видеоаналитика, беспилотные системы, мониторинг области интереса, управление воздушным движением и др. Использование групп наблюдателей в задаче отслеживания объектов обеспечивает больше преимуществ по сравнению с применением одного из них. В частности, из-за воздействия окружающей среды и неточностей измерительных компонентов каждый наблюдатель получает зашумленные наблюдения (измерения). Благодаря использованию нескольких наблюдателей можно получить более точную оценку измеренного значения посредством совместного учета полученных данных измерений. Другими словами, группы наблюдателей могут использоваться для уменьшения неопределенностей в наблюдениях за объектами.

Группа наблюдателей фактически является сетью наблюдателей (сенсорной сетью), состоящей из устройств, способных реагировать на изменения во внешней среде, самостроятельно обрабатывать данные и комму-ницировать с другими устройствами. При этом сенсорные сети довольно

часто применяются в системах отслеживания [108]. В общем случае, сенсорные сети оценивают состояние некоторого динамического процесса посредством коммуникаций между узлами в сети.

Существует три вида организационных схем сетей наблюдателей (сенсорных сетей): централизованная, распределенная и гибридная. Централизованные системы позволяют получить самую точную оценку, поскольку им доступны все или почти все получаемые сетевыми узлами измерения. Распределенные системы обладают такими свойствами, как лучшая отказоустойчивость и масштабируемость, а также имеют меньшие требования к пропускной способности сети по сравнению с централизованными. Гибридные системы обеспечивают компромисс между свойствами централизованных и распределенных систем. В таких системах можно комбинировать распределенную стратегию управления с локальными центрами совместной обработки информации.

Далее будет рассмотрена проблема фильтрации, то есть оценки состояния неизвестных параметров системы по имеющимся измерениям (наблюдениям), получаемым узлами сенсорной сети (наблюдателями), когда измерения содержат помехи. В-общем случае, системы слежения полагаются на фильтр Калмана, который является одним из наиболее распространенных алгоритмов для решения задач фильтрации. Тем не менее, когда система отслеживания должна сопровождать большое количество объектов, возникают значительные вычислительные и коммуникационные нагрузки. В диссертационной работе исследуются различные подходы для решения этой проблемы. В следующем разделе приводится общая постановка задачи, мотивирующая переход к решению проблемы оптимизации ресурсов каждого из наблюдателей, выполняющих задачу отслеживания траекторий движения группы объектов. После этого рассматриваются подходы, основанные на фильтрации Калмана, поисковой стохастической аппроксимации и линейных матричных неравенствах. Далее описываются преимущества замены централизованного отслеживания на подход, основанный на мультиагентных технологиях. Завершает раздел пример практического приложения для задачи коллек-

тивного поведения групп наблюдателей при их движении в неизвестной внешней среде.

1.1 Оценивание параметров движения

объектов на основе последовательности наблюдений

Рассмотрим общую постановку задачи и обозначим свойственные ей проблемы. Будем считать, что в зоне видимости п сенсоров (наблюдателей) находятся т объектов (см. Рис. 1.1). Необходимо распределить объекты между сенсорами таким образом, чтобы можно было достаточно точно предсказать траектории движения объектов при условии одновременной минимизации загруженности каждого сенсора и затрат на передачу сообщений между сенсорами.

Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Список литературы диссертационного исследования кандидат наук Ерофеева Виктория Александровна, 2018 год

Литература

[1] Амелина Н.О., Фрадков А.Л. Приближенный консенсус в стохастической динамической сети с неполной информацией и задержками в измерениях // Автоматика и телемеханика. - 2012. - № 11. - С. 6-29.

[2] Амелина Н.О., Фрадков А.Л. Метод усредненных моделей в задаче достижения консенсуса // Стохастическая оптимизация в информатике. - 2012. - Т. 8. - № 1. - С. 3-39.

[3] Алимов Н.А., Ерофеева В.А., Шалимов Д.С. Анализ возможностей методов классификации для автоматизации работы дефибриллятора // Стохастическая оптимизация в информатике. - 2017. -Т. 13. - № 1. - С. 3-30.

[4] Баландин Д.В., Коган М.М. Линейно-квадратичные и y-оптимальные законы управления по выходу // Автоматика и телемеханика. - 2008. - № 6. - С. 5-14.

[5] Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных матричных неравенств. - М.: Физматлит, 2007. - 281 с.

[6] Бычков И. В., Опарин Г. А., Феоктистов А. Г., Богданова В. Г., Пашинин А. А. Сервис-ориентированное мультиагентное управление распределенными вычислениями // Автоматика и телемеханика. - 2015. - № 11. - С. 118-131.

[7] Вахитов А.Т., Граничин О.Н., Гуревич Л.С. Алгоритм стохастической аппроксимации с пробным возмущением на входе в нестационарной задаче оптимизации // Автоматика и телемеханика. -2009. - № 11. - С. 70-79.

[8] Граничин О.Н. Поисковые алгоритмы стохастической аппроксимации с рандомизацией на входе // Автоматика и телемеханика. -2015. - № 5. - С. 43-59.

[9] Граничин О.Н., Поляк Б.Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. - М.: Наука, 2003. - 291 с.

[10] Граничин О.Н. Мультиагентные технологии и оптимизация в условиях неопределенности // Материалы XIX конференции молодых ученых "Навигация и управление движением" с международным участием. - 2017. - С. 15-16.

[11] Граничин О.Н. Об одной стохастической рекуррентной процедуре при зависимых помехах в наблюдении, использующей на входе пробные возмущения // Вестник Ленинградского университета. -1989. - Сер. 1. - Т. 1. - № 4. - С. 19-21.

[12] Граничин О.Н. Процедура стохастической аппроксимации с возмущением на входе // Автоматика и телемеханика. - 1992. - № 2. -С. 97-104.

[13] Граничин О. Н. Оптимальное управление линейным объектом с нерегулярными ограниченными помехами // В сб.: Тезисы докладов и сообщений Всесоюзной конференции "Теория адаптивных систем и ее применения". - 1983. - С. 26.

[14] Городецкий В.И., Бухвалов О.Л., Скобелев П.О. Современное состояние и перспективы индустриальных применений многоагент-ных систем // Управление большими системами. - 2017. - № 66. -С. 94-157.

[15] Деревицкий Д.П., Фрадков А.Л. Две модели для анализа динамики алгоритмов адаптации // Автоматика и телемеханика. - 1974. -№ 1. - С. 59-67.

[16] Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем управления. - М.: Наука, 1981. - 216 с.

[17] Ерофеева В.А., Иванский Ю.В., Кияев В.И. Управление роем динамических объектов на базе мультиагентного подхода // Компьютерные инструменты в образовании. - 2015. - № 6. - С. 34-42.

[18] Ерофеева В.А. Оптимизация распределения целей между наблюдателями и оценивание состояний с помощью циклического подхода // Стохастическая оптимизация в информатике. - 2018. - Т. 14. -№ 1. - С. 3-30.

[19] Ерофеева В.А. Мультиагентный подход в задаче оценивания траекторий движущихся объектов // Материалы XIX конференции молодых ученых "Навигация и управление движением" с международным участием. - 2017. - С. 70-72.

[20] Ерофеева В.А. Поисковой алгоритм стохастической аппроксимации в задаче балансировки загрузки при неизвестных, но ограниченных возмущениях на входе // Материалы научной конференции по проблемам информатики СПИС0К-2014. - 2014. - С. 123-130.

[21] Ерофеева В.А. Обзор теории интеллектуального анализа данных на базе нейронных сетей // Стохастическая оптимизация в информатике. - 2015. - Т. 11. - № 3. - С. 3-17.

[22] Железное К.О, Хлебников М.В. Синтез обратной связи для линейной системы управления с возмущением на входах и выходах: робастная постановка // Проблемы управления. - 2017. - № 3. - С. 11-16.

[23] Каляев И.А., Гайдук А.Р., Капустян С.Г. Модели и алгоритмы коллективного управления в группах роботов. - М.: ФИЗМАТЛИТ, 2009. - 280 с.

[24] Карпов М.И., Петросян Л.А. Кооперативные решения в коммуникационных сетях // Вестник Санкт-Петербургского Университета. Серия 10: Прикладная математика, информатика, процессы управления. - 2012. - С. 37-45.

[25] Петросян Л.А. Оптимизация управления подвижными объектами в условиях конфликта и неопределенности //В сб.: Управление в морских и аэрокосмических системах. - 2016. - С. 22-31.

[26] Поляк Б.Т, Цыбаков А.Б. Оптимальные порядки точности поисковых алгоритмов стохастической оптимизации // Проблемы передачи информации. - 1990. - Т. 26. - № 2. - С. 45-53.

[27] Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. - М.: Наука, 2002. - 303 с.

[28] Поляк Б.Т., Щербаков П.С. Техника Н-разбиения при решении линейных матричных неравенств // Автоматика и телемеханика. -2006. - № 11. - С. 159-174.

[29] Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными системами при внешних возмущениях: Техника линейных матричных неравенств. - М.: ЛЕНАНД, 2014. - 560 с.

[30] Поляк Б.Т., Хлебников М.В., Щербаков П.С. Разреженная обратная связь в линейных системах управления // Автоматика и телемеханика. - 2014. - № 12. - С. 13-27.

[31] Поляк Б.Т., Хлебников М.В., Щербаков П.С. Разреженная обратная связь в линейных системах управления // Автоматика и телемеханика. - 2014. - № 12. - С. 13-27.

[32] Поляк Б.Т., Цыбаков А.Б. Оптимальные порядки точности поисковых алгоритмов стохастической аппроксимации // Проблемы передачи информации. - 1990. - Т. 26. - С. 126-133.

[33] Попов В.М. Об абсолютной устойчивости нелинейных систем автоматического регулирования // Автоматика и телемеханика. - 1961.

- Т. 22. - № 8. - С. 961-979.

[34] Попов В.М. Об одной задаче теории абсолютной устойчивости регулируемых систем // Автоматика и телемеханика. - 1964. - Т. 25.

- № 9. - С. 1257-1262.

[35] Чеботарев П. Ю., Агаев Р. П. Согласование характеристик в мно-гоагентных системах и спектры лапласовских матриц орграфов // Автоматика и телемеханика. - 2009. - № 3. - С. 136-151.

[36] Якубович В.А. Метод матричных неравенств в теории устойчивости нелинейных регулируемых систем. I. Абсолютная устойчивость вынужденных колебаний // Автоматика и телемеханика. - 1964. -Т. 25. - № 7. - С. 1017-1029.

[37] Якубович В.А. Метод матричных неравенств в теории устойчивости нелинейных регулируемых систем. II. Абсолютная устойчивость в классе нелинейностей с условием на производную // Автоматика и телемеханика. - 1965. - Т. 26. - № 4. - С. 577-592.

[38] Amelina N., Erofeeva V., Granichin O., Malkovskii N. Simultaneous perturbation stochastic approximation in decentralized load balancing problem // IFAC-PapersOnLine. - 2015. - Vol. 48, No. 11. - P. 936941.

[39] Amelina N., Fradkov A., Jiang Y., Vergados D.J. Approximate consensus in stochastic networks with application to load balancing // IEEE Transactions on Information Theory. - 2015. - Vol. 61, No. 4.

- P. 1739-1752.

[40] Borkar V. S. Stochastic Approximation: a Dynamical Systems Viewpoint. - Cambidge University Press, 2008. - 176 p.

[41] Borkar V., Varaiya P. Asymptotic agreement in distributed estimation // IEEE Transactions on Automation Control. - 1982. - Vol. 27, No. 3. - P. 650-655.

[42] Bhatti S., Beck C.L., Nedich A. Large scale data clustering and graph partitioning via simulated mixing // In: Proc. of 55th IEEE Conference on Decision and Control. - 2016. - P. 147-152.

[43] Boyd S., Parikh N., Chu E., Peleato B., Eckstein J. Distributed optimization and statistical learning via the alternating direction method of multipliers // Foundations and Trends in Machine Learning.

- 2011. - Vol. 3, No. 1. - P. 1-122.

[44] Bullo F., Cortes J., Martinez S. Distributed Control of Robotic Networks: a Mathematical Approach to Motion Coordination Algorithms. - Princeton University Press, 2009. - 320 p.

[45] Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. - Siam, 1994. - V. 15.

[46] Boyd S., Vandenberghe L. Convex Optimization. - Cambridge university press, 2004. - 727 p.

[47] Blum J.R. Multidimensional stochastic approximation // The Annals of Mathematical Statistics. - 1954. - Vol. 9. - P. 737-744.

[48] Bianchi P., Jakubowicz J. Convergence of a multi-agent projected stochastic gradient algorithm for non-convex optimization // IEEE Transactions on Automation Control. - 2013. - Vol. 58, No. 2. - P. 391-405.

[49] Calafiore G, Polyak B.T. Stochastic algorithms for exact and approximate feasibility of robust LMIs // IEEE Transactions on Automatic Control. - 2001. - Vol. 46, No. 11. - P. 1755-1759.

[50] DeGroot M.H. Reaching a consensus // Journal of the American Statistical Association. - 1974. - Vol. 69, No. 345. - P. 118-121.

[51] Di Lorenzo P., Scutari G. Next: in-network nonconvex optimization // IEEE TSIPN. - 2016. - Vol. 2, No. 2. P. 120-136.

[52] Erofeeva V., Granichin O., Kiyaev V. Multi-agent based adaptive swarm robotics control in dynamically changing and noisy environments // In: Proc. of Russian Supercomputing Days. -2016. - P. 808-813.

[53] Fax J.A., Murray R.M. Information flow and cooperative control of vehicle formations // IEEE Transactions on Automatic Control. - 2004.

- Vol. 49, No. 9. - P. 1465-1476.

[54] Friedkin N.E., Proskurnikov A.V., Tempo R., Parsegov S.E. Network science on belief system dynamics under logic constraints // Science. -2016. - Vol. 354, No. 6310. - P. 321-326.

[55] Granichin O., Amelina N. Simultaneous perturbation stochastic approximation for tracking under unknown but bounded disturbances // IEEE Transactions on Automatic Control. - 2015. - Vol. 60, No. 6.

- P. 1653-1658.

[56] Granichin O., Gurevich L., Vakhitov A. Discrete-time minimum tracking based on stochastic approximation algorithm with randomized differences // In: Proc. of 48th IEEE Conference on Decision and Control. - 2009. - P. 5763-5767.

[57] Granichin, O., Volkovich, Z. and Toledano-Kitai, D. Randomized Algorithms in Automatic Control and Data Mining. - Springer, 2015.

- 251 p.

[58] Hernandez K., Spall J.C. Cyclic stochastic optimization with noisy function measurements // In: Proc. of American Control Conference.

- 2014. - P. 5204-5209.

[59] Hernandez K. Cyclic stochastic optimization via arbitrary selection procedures for updating parameters // In: Proc. of Information Science and Systems Conference. - 2016. - P. 349-354.

[60] Hernandez K., Spall J.C. Asymptotic normality and efficiency analysis of the cyclic seesaw stochastic optimization algorithm // In: Proc. of American Control Conference. - 2016. - P. 7255-7260.

[61] Hernandez K. Cyclic Stochastic Optimization: Generalizations, Convergence, and Applications in Multi-Agent Systems. - Ph.D. Thesis. - 2017.

[62] Huang M, Manton J.H. Coordination and consensus of networked agents with noisy measurements: stochastic algorithms and asymptotic behavior // SIAM Journal on Control and Optimization. - 2009. - Vol.

48, No. 1. - P. 134-161.

[63] Jadbabaie A., Lin J., Morse A.S. Coordination of groups of mobile autonomous agents using nearest neighbor rules // IEEE Transactions on Automatic Control. - 2003. - Vol. 48, No. 6. - P. 988-1001.

[64] Kushner H., Yin G.G. Stochastic Approximation and Recursive Algorithms and Applications. - V. 35. - Springer Science & Business Media, 2003. - 478 p.

[65] Kiefer J., Wolfowitz J. Statistical estimation on the maximum of a regression function // The Annals of Mathematical Statistics. - 1952.

- Vol. 23. - P. 462-466.

[66] Kalman R.E. A new approach to linear filtering and prediction problems // Journal of Basic Engineering. - 1960. - Vol. 82, No. 1.

- P. 35-45.

[67] Kalman R.E. Lyapunov functions for the problem of Lur'e in automatic control // In: Proc. of the National Academy of Sciences. - 1963. - Vol.

49, No. 2. - P. 201-205.

[68] Karmarkar N. A new polynomial-time algorithm for linear programming // In: Proc. of the 16th Annual ACM Symposium on Theory of Computing. - 1984. - P. 302-311.

[69] Kong J., Pfeiffer M., Schildbach G., Borrelli F. Kinematic and dynamic vehicle models for autonomous driving control design // In: Proc. of Intelligent Vehicles Symposium. - 2015. - P. 1094-1099.

[70] Lur'e A.I. Some Non-linear Problems in the Theory of Automatic Control. - Her Majesty's stationery office, 1957. - 165 p.

[71] Lur'e A.I., Postnikov V.N. On the theory of stability of control systems // Applied Mathematics and Mechanics. - 1944. - Vol. 8, No. 3. - P. 246-248.

[72] Lyapunov A.M. The general problem of motion stability // Annals of Mathematics Studies. - 1892. - V. 17.

[73] Lynch N.A. Distributed Algorithms. - Elsevier, 1996. - 904 p.

[74] Lewis F.L., Zhang H., Hengster-Movric K., Das A. Cooperative Control of Multi-agent Systems: Optimal and Adaptive Design Approaches. - Springer Science & Business Media, 2013.

[75] Mhanna S., Chapman A.C., Verbic G. A fast distributed algorithm for large-scale demand response aggregation // IEEE Transactions on Smart Grid. - 2016. - Vol. 7. - P. 2094-2107.

[76] Nedic A., Ozdaglar A., Parrilo P.A. Constrained consensus and optimization in multi-agent networks // IEEE Transactions on Automatic Control. - 2010. - Vol. 55, No. 4. - P. 922-938.

[77] Nedic A., Olshevsky A. Distributed optimization over time-varying directed graphs // IEEE Transactions on Automatic Control. - 2015.

- Vol. 60, No. 3. - P. 601-615.

[78] Nedic A., Ozdaglar A. Distributed subgradient methods for multi-agent optimization // IEEE Transactions on Automatic Control. - 2009. -Vol. 54, No. 1. - P. 48-61.

[79] Nesterov Y, Nemirovsky A. A general approach to polynomial-time algorithms design for convex programming // Report, Central Economical and Mathematical Institute, USSR Academy of Sciences, Moscow. - 1988.

[80] Nesterov Y., Nemirovskii A. Interior-point Polynomial Algorithms in Convex Programming. - Siam, 1994. - 405 p.

[81] Olfati-Saber R., Murray R.M. Consensus problems in networks of agents with switching topology and time-delays // IEEE Transactions on Automatic Control. - 2004. - Vol. 49, No. 9. - P. 1520-1533.

[82] Olfati-Saber R. Distributed Kalman filter with embedded consensus filters // In: Proc. of 44th IEEE Conference on Decision and Control.

- 2005. - P. 8179-8184.

[83] Proskurnikov A.V., Matveev A.S., Cao M. Opinion dynamics in social networks with hostile camps: Consensus vs. polarization // IEEE Transactions on Automatic Control. - 2016. - Vol. 61, No. 6. - P. 1524-1536.

[84] Proskurnikov A.V. Average consensus in networks with nonlinearly delayed couplings and switching topology // Automatica. - 2013. -Vol. 49, No. 9. - P. 2928-2932.

[85] Polyak B., Khlebnikov M., Shcherbakov P. An LMI approach to structured sparse feedback design in linear control systems // In: Proc. of 2013 European Control Conference (ECC). - 2013. - P. 833-838.

[86] Polyak V.T., Tsybakov A.V. On stochastic approximation with arbitrary noise (the KW Case) // Topics in Nonparametric Estimation.

- 1992. - V. 12. - P. 107-113.

[87] Peng C, Hui Q. Real-time distributed decomposition for large-scale distributed fault diagnosis over dynamic graphs // In: Proc. of American Control Conference. - 2016. - P. 2472-2477.

[88] Ren W, Beard R.W. Consensus seeking in multi-agent systems under dynamically changing interaction topologies // IEEE Transactions on Automatic Control. - 2005. - Vol. 50, No. 5. - P. 655-661.

[89] Ren W, Beard R. W, Atkins E.M. Information consensus in multi-vehicle cooperative control // IEEE Control Systems. - 2007. - Vol. 27, No. 2. - P. 71-82.

[90] Rzevski G., Skobelev P. Managing Complexity. - Wit Press, 2014.

[91] Rajagopal R., Wainwright M. J. Network-based consensus averaging with general noisy channels // IEEE Transactions on Signal Processing.

- 2011. - Vol. 59, No. 1. - P. 373-385.

[92] Robbins H., Monro S. A stochastic approximation method // The Annals of Mathematical Statistics. - 1951. - Vol. 22. - P. 400-407.

[93] Rabbat M., Nowak R. Distributed optimization in sensor networks // In: Proc. of the 3rd international Symposium on Information Processing in Sensor Networks. - 2004. - P. 20-27.

[94] Spall J.C. Introduction to Stochastic Search and Optimization: Estimation, Simulation, and Control. - John Wiley & Sons, 2005. -618 p.

[95] Spall J.C. Identification for systems with binary subsystems // IEEE Transactions on Automatic Control. - 2014. - Vol. 59, No. 1. - P. 3-17.

[96] Spall J.C. Multivariate stochastic approximation using a simultaneous perturbation gradient approximation // IEEE Transactions on Automatic Control. - 1992. - Vol. 37, No. 3. - P. 332-341.

[97] Spall J.C. A one measurement form of simultaneous perturbation stochastic approximation // Automatica. - 1997. - Vol. 33. - P. 109112.

[98] Spall J.C. Cyclic seesaw process for optimization and identification // Journal of Optimization Theory and Applications. - 2012. - Vol. 154, No. 1. - P. 187-208.

[99] Spall J.C. Identification for systems with binary subsystems // IEEE Transactions on Automatic Control. - 2014. - Vol. 59, No. 1. - P. 3-17.

[100] Slotani M. Tolerance regions for a multivariate normal population // Annals of the Institute of Statistical Mathematics. - 1964. - Vol. 16, No. 1. - P. 135-153.

[101] Shchegryaev A. N., Zakharov V. V. Multi-period cooperative vehicle routing games // Contributions to Game Theory and Management. -2014. - Vol. 7. - P. 349-359.

[102] Tsitsiklis J.N. Problems in Decentralized Decision Making and Computation. - Ph.D. dissertation, MIT. - 1984.

[103] Tsitsiklis J., Bertsekas D., Athans M. Distributed asynchronous deterministic and stochastic gradient optimization algorithms // IEEE Transactions on Automatic Control. - 1986. - Vol. 31, No. 9. - P. 803812.

[104] Vicsek T, Czirok A., Ben-Jacob E., Cohen I, Shochet O. Novel type of phase transition in a system of self-driven particles // Physical review letters. - 1995. - Vol. 75, No. 6. - P. 1226-1229.

[105] Vicsek T., Zafeiris A. Collective motion // Physics Reports. - 2012. -Vol. 517, No. 3-4. - P. 71-140.

[106] Vergados D.J., Amelina N., Jiang Y., Kralevska K., Granichin O. Towards optimal distributed node scheduling in a multihop wireless network through Local Voting // IEEE Transactions on Wireless Communications. - 2018. - Vol. 17, No. 1. - P. 400-414.

[107] Wooldridge M. An introduction to Multi-agent Systems. - John Wiley & Sons, 2009. - 484 p.

[108] Wei B., Nener B., Liu W., Ma L. Centralized multi-sensor multitarget tracking with labeled random finite sets // In: Proc. of International Conference on Control, Automation and Information Sciences (ICCAIS). - 2016. - P. 82-87.

[109] Jakubovic V.A. The solution of certain matrix inequalities in automatic control // Soviet Math. - 1962. - Vol. 3. - P. 620-623.

[110] Yacubovich V.A. Solution of certain matrix inequalities encountered in nonlinear control theory // Soviet Doklady Mathematics. - 1964. -Vol. 5. - P. 652-656.

[111] Yakubovich V.A. Dichotomy and absolute stability of nonlinear systems with periodically nonstationary linear part // Systems & control letters. - 1988. - Vol. 11, No. 3. - P. 221-228.

[112] Yang Y., et al. A Parallel decomposition method for nonconvex stochastic multi-agent optimization problems // IEEE Transactions on Signal Processing. - 2016. - Vol. 64, No. 11. - P. 2949-2964.

[113] Yin G., Wang L.Y., Zhang H. Stochastic approximation methods-powerful tools for simulation and optimization: a survey of some recent work on multi-agent systems and cyber-physical systems // In: AIP Conference Proceedings. - 2014. - Vol. 1637, No. 1. - P. 1263-1272.

[114] Zhu J., Spall J. C. Tracking capability of stochastic gradient algorithm with constant gain // In: Proc. of the 55th Conference on Decision and Control. - 2016. - P. 4522-4527.

[115] Zhu M., Martinez S. Discrete-time dynamic average consensus // Automatica. - 2010. - Vol. 46, No. 2. - P. 322-329.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.