Проектирование системы отслеживания и прогнозирования движения объектов в видеопотоке тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Шелабин, Дмитрий Алексеевич
- Специальность ВАК РФ05.13.18
- Количество страниц 120
Оглавление диссертации кандидат наук Шелабин, Дмитрий Алексеевич
Оглавление
Введение
Актуальность, новизна и цели работы
Общая архитектура
Глава 1. Обнаружение движения в видео потоке
§1.1 Обзор существующих подходов
§1.2 Алгоритм на основе смеси нормальных распределений
§1.2.1 Простая вероятностная модель фона снимаемой сцены
§ 1.2.2 МвМ-алгоритм
§ 1.3 Адаптация и прогнозирование параметров модели фона
§1.4 Пространственная обработка, переход к связным областям
§1.4.1 Фильтрация
§ 1.4.2 Связные области
Глава 2. Трассировка движущихся объектов
§2.1 Обзор существующих подходов
§2.2 Классификация связных областей, классы областей и построение траекторий
§2.2.1 Сравнение областей связности и классов по гистограмме цветового распределения
§2.2.2 Сравнение областей связности и классов по положению и скорости, прогнозирование движения
§2.2.3 Распределение областей по классам, процесс классификации
Глава 3. Прототип системы, практическая реализация
§3.1 Архитектура
§3.2 Результаты работы
Заключение
Литература и ссылки
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Идентификация подвижных наземных объектов с борта беспилотного летательного аппарата2013 год, кандидат технических наук Казбеков, Борис Валентинович
Метод и система детектирования и классификации движущихся объектов в видеопоследовательности2018 год, кандидат наук Шепелев, Кирилл Валерьевич
Программная система выявления нелегитимной активности на промышленных площадках2013 год, кандидат наук Абрамов, Николай Александрович
Методы стабилизации видеопоследовательностей сложных статических и динамических сцен в системах видеонаблюдения2014 год, кандидат наук Буряченко, Владимир Викторович
Алгоритмы обнаружения лица на основе анализа и обработки изображений2017 год, кандидат наук Мохаммед Мамдух Мохаммед Гомаа
Введение диссертации (часть автореферата) на тему «Проектирование системы отслеживания и прогнозирования движения объектов в видеопотоке»
Введение
Актуальность, новизна и цели работы
В современном мире большую роль в сборе информации играют различные системы видеонаблюдения. Системами видеонаблюдения оснащаются многие предприятия, организации и важные объекты инфраструктуры. Такие системы используются для охраны или мониторинга определённых ситуаций. При этом вместе с развитием вычислительной техники и информационных технологий возрастает и количество систем видеонаблюдения, которые создаются для того чтобы упростить работу операторов или же полностью автоматизировать наблюдение за объектом. Системы видеонаблюдения должны быть максимально автоматизированы, они должны выделять из всего потока информации нужные данные в удобном для анализа виде. Разработка систем видео наблюдения остаётся актуальной и сейчас, так как все разрабатываемые системы видеонаблюдения рассчитаны на работу в различных условиях и поэтому различны и требования, предъявляемые к этим системам.
Среди всего разнообразия задач, для решения которых создаются системы видеонаблюдения, выделяется задача автоматического отслеживания движущихся объектов в видеопотоке. Система отслеживания движущихся объектов в видеопотоке необходима сегодня во многих областях. Информация, полученная от такой системы отслеживания, может быть использована для анализа характеристик объекта, таких как скорость, размер и путь объекта, или для прогнозирования дальнейшего движения объекта. Эти данные, например, могут быть использованы для мониторинга дорожной ситуации, обнаружения аварий или других событий. Также эти данные могут быть использованы для управления ракурсом съемки, например, обзор события с разного ракурса, снятого множеством устройств.
Работа системы отслеживания движущихся объектов направлена на трассировку перемещений объектов в потоке кадров. Подобная система должна хорошо работать при различных внешних условиях, таких как меняющийся задний план, изменяющиеся освещение, движущиеся тени, перекрытие движущихся объектов друг другом и другие изменения которые могут происходить в снимаемой сцене.
Система должна уметь отслеживать группы произвольно движущихся объектов. Причём объекты, могут сливаться или разделяться в снимаемой сцене, а их траектории могут пересекаться или может происходить перекрытие объектов статичными предметами фона. Система должна не только отслеживать перемещение групп объектов при различных условиях, но и определять характеристики этого движения.
Задачу отслеживания движущихся объектов можно разделить на несколько подзадач. Среди всего набора подзадач можно выделить две наиболее существенные, которые, так или иначе, присутствуют во всех подобных системах. Первая важная подзадача - выявление значимых активных областей на кадре, где происходит движение. Для этой цели применяются алгоритмы обнаружения движения. Вторая важная подзадача - это отслеживание перемещений множества обнаруженных значимых активных областей, найденных на соседних кадрах, и объединение их в одну группу, сопровождаемое построением траектории движения. Для этого применяются алгоритмы трассировки.
Цель диссертационной работы — исследование методов обнаружения и трассировки объектов, разработка модификаций этих методов и создание действующего прототипа системы отслеживания и прогнозирования движения объектов в видеопотоке. Для достижения поставленной цели необходимо решить следующие задачи:
• Разработать обобщение (модификацию) алгоритма обнаружения движения, использующего смесь нормальных распределений.
• Подобрать и модернизировать необходимые методы обработки изображений.
• Формализовать и обобщить предметную область для трассировки объектов так, чтобы можно было использовать модели адаптивного прогнозирования.
• Разработать алгоритм трассировки объектов с применением классификации активных областей на кадрах, таким образом, чтобы учитывалось, во-первых, скорость/положение классифицируемых активных областей и прогнозируемое положение для следующей точки траектории, и, во-вторых, цветовое распределение активных областей.
• Произвести анализ и сравнение предложенных и существующих подходов;
• Разработать архитектуру приложения для прототипа системы, реализовать эту архитектуру в приложении, исследовать работу прототипа.
Для решения поставленных задач использовалась теория вероятности и математическая статистика, теория байесовских сетей, теория цифровой обработки сигналов, математическое моделирование, дискретная математика, информатика, теория графов и методы анализа и прогнозирования временных рядов.
Научная новизна состоит в разработке, модификации и анализе методов необходимых для создания системы отслеживания движущихся объектов. При выполнении диссертационной работы получены следующие новые научные результаты:
• Предложено обобщение алгоритма обнаружения движения, основанного на стандартном алгоритме вычитания фона использующего смесь нормальных распределений. В модификации использованы многомерные нормальные распределения, вместо одномерных распределений, что позволяет более точно представлять цветовую информацию. Также при адаптации модели используется ещё одно пороговое значение, что позволяет улучшить результат и увеличить стабильность работы алгоритма.
• Разработан новый алгоритм трассировки, реализованный как пошаговый адаптивный алгоритм, работающий в реальном времени и основанный на классификации активных областей, использующей положение, скорость и цветовое распределение активных областей.
• Впервые используются модели адаптивного прогнозирования временных рядов при трассировке (построении траекторий).
• Произведены разработка и описание архитектуры приложения прототипа системы. Созданное приложение оптимальным образом реализует описанные в работе методы таким образом, что их можно легко тестировать независимо друг от друга, используя различные наборы данных.
Практическая значимость работы определяется тем, что описанные в ней алгоритмы и методы позволяют улучшить результаты и уменьшить количество
ошибок при обнаружении движения и трассировке движущихся объектов. Предложенная модификация алгоритма обнаружения движения работает более точно и более стабильно, чем стандартные алгоритмы вычитания фона. Описанный адаптивный алгоритм трассировки работает пошагово и в реальном времени с использованием различной доступной информации об объекте. Все приводимые в работе методы и алгоритмы рассматриваются с точки зрения удобства практического использования и удобства программирования. В работе также описывается общая архитектура приложения прототипа системы.
Достоверность научных результатов обусловлена применением общепринятых математических методов и подтверждается результатами экспериментов на ЭВМ, проведённых над созданным прототипом системы и над различными его модулями.
Общая архитектура
Проектируемая система предназначена для работы с видеопотоком, поступающим с неподвижной видеокамеры. Система является системой реального времени, т.е. отслеживание основано на информации, извлечённой из видеопоследовательности до текущего момента времени. После обработки каждого кадра обновляется внутренние состояние системы и выдаётся результат в виде информации о текущем положении объектов, их характеристиках и перемещении.
Практически во всех системах отслеживания движущихся объектов можно выделить несколько этапов работы. Первый этап работы подобной системы - это применение алгоритма обнаружения движущихся объектов к входной видео последовательности [1, 2]. Цель этого алгоритма обнаружения найти в кадре активные регионы, где непосредственно происходит движение. Принцип работы большинства подобных алгоритмов заключается в постепенном накапливании информации и построении модели заднего плана снимаемой сцены. При поступлении очередного кадра - его пиксели сравниваются с соответствующими пикселями модели фона, после чего алгоритм определяет: является ли данный пиксель кадра фоновым или же этот пиксель принадлежит движущемуся объекту. Затем уже пиксели этого кадра служат для обновления модели фона. Таким образом, резуль-
татом работы будет бинарная маска, получаемая при поступлении каждого кадра. В ней пиксели, отнесённые к фону, имеют значение равное нулю, а пиксели, отнесённые к объекту, имеют значение равное единице. На рисунке 1 показана общая схема работы системы отслеживания. Входными данными для обнаружения движения являются кадры видеопоследовательности. Выходными данными - бинарные маски, полученные после обработки кадров.
Исходная видео последовательность
в* кадр Ж
Обнаружение движения
Связывание пикселей
Связанные области
г ч Трассировка
Е 1 ■ движущимся ■ а
Набор движущихся объектов и их характеристик
Рис. 1. Общая структура процесса
На втором этапе работы системы слежения происходит дополнительная обработка и объединение пикселей бинарной маски в отдельные области. К входно-
му кадру применяется фильтрация, например, медиальный фильтр. Это позволяет удалить резкие скачки яркости на кадре, вызванные шумами. На втором этапе происходит фильтрация другого рода. Во-первых, из бинарной маски удаляются пиксели, соответствующие теням от движущегося объекта на кадре. Во-вторых, к бинарной маске применяются морфологические операции. Целью является удаление отдельных небольших групп пикселей, сглаживание контуров и заполнение промежутков. В-третьих, на основе 4- или 8-связности пикселей, происходит связывание пикселей бинарной маски в отдельные связные регионы - области связности или связные области. Связные области, в зависимости от контекста, также могут называтся активными областями. Происходит анализ размера, положения областей связности. Выбраковываются области связности с неподходящими характеристиками. На втором этапе входными данными служат бинарные маски, а выходными - наборы связных областей и их характеристики. Связные области -это потенциальные объекты движения. То есть связная область это возможный "образ" реального движущегося объекта в текущий момент времени. В противоположность первому этапу, на котором происходит анализ пикселей во времени, на втором этапе происходит пространственный анализ пикселей.
На третьем этапе происходит отслеживание перемещений множества найденных связных областей на разных кадрах. Осуществляется объединение схожих по характеристикам областей на соседних по времени кадрах в класс (набор). Этот класс, в свою очередь, имеет характеристики, полученные на основе характеристик связных областей, которые его сформировали. Среди этих параметров: некоторые усреднённые значения, траектория, динамика изменения скорости, гистограмма цветового распределения связных областей класса. На этом уровне уже можно говорить о классе связных областей как о движущемся отслеживаемом объекте. А характеристики классов областей можно использовать для получения характеристик движущихся объектов. Таким образом, на этом этапе происходит трассировка, строятся траектории объектов. Здесь используются, так называемые, алгоритмы трассировки, часто использующие в своей основе байесовские сети [3]. На этом этапе приходится решать такие проблемы как: отслеживание групп объ-
ектов, которые могут сливаться и разделятся в снимаемой сцене, может происходить перекрытие объекта некоторым статичным объектом фона, может происходить появление и исчезновение объектов. Все эти особенности вносят дополнительные сложности. Входными данными на третьем этапе служат наборы связных областей, найденных на кадре, а выходными - объекты движения, заданные классами схожих по характеристикам связных областей.
Как итог, можно выделить несколько понятий, которые будут использоваться в дальнейшем:
кадр - растровое изображение, поступившее с камеры в некоторый момент времени;
видеопоток - последовательность кадров, полученная от цифровой видеокамеры или полученная из видео файла;
алгоритм обнаружения - алгоритм, используемый для обнаружения в кадре активных регионов, где непосредственно происходит движение;
бинарная маска движения - бинарное изображение, полученное в результате работы алгоритма обнаружения и содержащие в себе информацию об активных регионах, т.е. активным регионам соответствуют не нулевые пиксели бинарной маски;
связная область, активная область, активный регион или просто область -группы связных (соседних) пикселей, полученные после обработки бинарной маски, представляют собой регионы кадра, где обнаружено движение, интерпретируются как отражения физических объектов в текущий момент времени;
движущийся объект - класс связных областей расположенных на соседних по времени кадрах и объединённых по сходству некоторых своих характеристик, интерпретируются как "образ" физического движущегося объекта в некоторые моменты времени;
движение - поступательное движение некоторой группы связных пикселей, наблюдаемое на соседних кадрах видеопотока;
трассировка — отслеживание перемещения активных регионов на различных кадрах.
Глава 1. Обнаружение движения в видео потоке
В этой главе речь пойдёт о первых двух этапах работы системы отслеживания. Между этими этапами трудно провести четкую границу, поэтому они описываются вместе. Глава состоит из четырех параграфов. В первом делается обзор существующих алгоритмов, во втором описывается модификация алгоритма обнаружения движения основанного на смеси распределений [1, 4]. В третьем параграфе дается анализ использованного способа адаптации значений модели. В четвертом параграфе описаны методы, относящиеся ко второму этапу работы системы: фильтрация теней, морфологические операции и построение связных областей.
§1.1 Обзор существующих подходов
Задача автоматического обнаружения движущихся объектов не имеет общего решения, несмотря на то, что попытки найти его начали предприниматься достаточно давно. Это объясняется тем, что обнаружение может происходить при различных условиях. Может существенно различаться уровень шума. Природные явления могут вносить искажения в снимаемую сцену. Процесс обнаружения может происходить при динамически изменяющемся заднем фоне снимаемой сцены и т.д. Все это делает алгоритмы, отлично работающие в одних условиях, совершенно непригодными для других. Существует довольно много алгоритмов обнаружения. Среди них можно выделить несколько наиболее интересных.
Первый и самый простой алгоритм: basic background subtraction (BBS) -простой алгоритм вычитания фона [5]. Он вычисляет модуль разности между значениями интенсивности пикселей статичного фона (базового кадра) и текущего кадра. Затем полученная разность сравнивается с заданным порогом. Этот алгоритм часто называют алгоритмом вычитания из базового кадра [6]. Здесь возможны два типа ошибок. Первый тип - пиксель объекта был классифицирован как фоновый, второй - фоновый пиксель был классифицирован как пиксель объекта. Изменяя порог, можно регулировать работу алгоритма. Основная трудность - какой именно кадр из всей последовательности кадров считать фоном. Очевидными достоинствами данного алгоритма являются простота реализации и высокая про-
изводительность. Для данного алгоритма обнаружения существует ряд проблем, которые также характерны и для других алгоритмов:
• Изменения заднего плана делают этот алгоритм малопригодным для работы в реальных условиях. Если изменяется какая-нибудь часть фона, то в этом месте кадра обнаруживается ложный активный регион. Например, если исчезает предмет на заднем плане, появляется новый предмет или присутствуют циклические изменения (например, дрожание листвы или мерцание света). Таким образом, главный недостаток этого алгоритма это статичный базовый кадр, который просто выбирается алгоритмом. В общем случае, базовый кадр должен динамически изменяться, отражая изменения, происходящие в снимаемой сцене.
• Изменения освещения практически полностью меняют цветовые характеристики фона. В итоге из-за сильного изменения освещения алгоритм будет сегментировать как объект большую часть сцены.
• Движущиеся тени. Тени от движущихся объектов могут вносить сильные искажения. Для решения этой проблемы часто применяют дополнительные алгоритмы, позволяющие обнаружить и исключить тени от движущихся объектов.
• Шумы, присутствующие в кадрах видеопотока, негативно сказываются на результатах работы алгоритма. Поэтому кадры, поступающие от камеры, нужно пропускать через различные фильтры, сглаживающие или удаляющие эти шумы. Примерами таких фильтров могут послужить медиальный фильтр или фильтр Винера.
"Модификацией этого алгоритма является алгоритм межкадровой разности. Ос^ новное отличие в том, что вычисляется разность не между кадром и базовым кадром, а между двумя кадрами отстоящими друг от друга на некоторый интервал времени. Алгоритм межкадровой разности немного лучше BBS, но сохраняет все его недостатки. Различие заключается только в выборе кадров для вычисления разности. Для обеих модификаций алгоритма характерны скорость работы и простота реализации. Но оба они имеют одни и те же недостатки. Хотя, для алгорит-
ма межкадровой разности нет трудностей при выборе базового кадра, но зато обнаружение объекта алгоритмом зависит от скорости движущегося объекта.
Второй алгоритм, который стоит отметить, используется в системе W4, описанной в работе [7]. Этот алгоритм строит модель фона, используя для описания интенсивности каждого пикселя фона с координатами jc и у 3 характеристики. Первая характеристика - минимальное значение интенсивности пикселя с координатами х и у взятое за весь период наблюдения Min(x,y). Вторая - максимальное значение интенсивности пикселя с координатами jc и у взятое за весь период наблюдения Мах(х,у). Третья - максимальный модуль разности значений интенсивности пикселя с координатами х и у на соседних кадрах взятый за весь период наблюдения D(x,у). При этом, используются изображения, представленные в оттенках серого. Для построения модели фона используется обучающий набор, не содержащий движущихся объектов. Пиксель с координатами х и у кадра с номером t считается переднеплановым, т.е. активным, если для интенсивности этого пикселя It (х, у) выполняются оба соотношения:
(/t(*,y) < Min(x,y)) V(/t(x,y) > Мах(х,у)) \It(x,y)-It-1(x,y)\>D(x,y).
Третий алгоритм SGM (Single Gaussian Model) моделирует значения интенсивности пикселей фона с использованием нормальных распределений [8]. Этот алгоритм моделирует значение каждого пикселя фона случайной величиной, распределённой по нормальному закону. Таким образом, для каждого пикселя фона рассчитывается приближённые значения математического ожидания и дисперсии нормального распределения. При получении каждого кадра, его пиксели сравнивается с моделируемыми пикселями фона, после чего определяются фоновые пиксели и пиксели, где происходит движение. Затем пиксели модели фона обновляются согласно полученным данным.
Четвёртый алгоритм MGM (Multiple Gaussian Model) [1, 4] основан на смеси нормальных распределений. Этот алгоритм является более сложной версией предыдущего. Основное отличие в том, что для моделирования интенсивности каждого пикселя фона используется смесь распределений. Согласно [5], это алго-
ритм имеет один из лучших результатов, но при этом имеет большую трудоёмкость.
Описанные четыре алгоритма относят к одному типу алгоритмов обнаружения движения, который называют вычитанием фона {Background Subtraction). Алгоритмы вычитания фона распространены благодаря своей высокой производительности.
Существует группа методов, основанная на понятии оптического потока {Optic Flow). Вычисление оптического потока заключается в том, чтобы оценить смещение изображения в каждой точке, используя данные об интенсивности пикселей на последовательных кадрах. Среди методов, основанных на оптическом потоке, можно выделить три основных метода: дифференциальные методы, расчёт фазовой корреляции и методы, основанные на сопоставлении окрестностей. Методы, основанные на понятии оптического потока, являются альтернативой для алгоритмов вычитания фона. Однако, в контексте поставленной задачи (при обработке изображений, поступающих со стационарной камеры) целесообразнее использовать более производительные алгоритмы, основанные на моделировании фона снимаемой сцены, т.е. алгоритмы вычитания фона. Следует отметить, что основное преимущество методов, основанных на оптическом потоке, это то, что камера может и не быть статично закреплена, т.е. камера может перемещаться.
§1.2 Алгоритм на основе смеси нормальных распределений
Прежде чем приступить к описанию модификации MGM алгоритма, опишем принцип построения вероятностной модели фона, на примере SGM алгорит--мат-Этот-алгоритм-имеетвсвоей-основетот-жепринцип—но_являетсяболеепро-стым, что позволит сделать необходимые оговорки и допущения перед описанием более сложного MGM алгоритма.
§1.2.1 Простая вероятностная модель фона снимаемой сцены
Будем рассматривать SGM алгоритм с трёхмерным нормальным распределением, описывающим значение пикселя в цветовом пространстве RGB. Часто используют одномерное распределение, переводя цветное изображение в полутоновое, но это ведёт к потере полезной информации.
Многомерное нормальное распределение [9, 10] это обобщение одномерного нормального распределения. Пусть случайный векторX = (х1,х2, ...,хп)т:П Ип имеет многомерное нормальное распределение, т.е. X — Е). Тогда функция плотности вероятности этого случайного вектора имеет вид:
1 (Х-ц^Е^ОС-ц)
/,«,(*) = ¿щще 5 Д6Й". (1)
где вектор средних значений элементов вектора X, а I - неотрицательно
определённая симметричная ковариационная матрица [11] размерности п X п. Отметим, что в случае п = 1, многомерное нормальное распределение сводится к обычному нормальному распределению.
Ковариационная матрица— это матрица, составленная из попарных кова-риаций элементов двух случайных векторов X: П В71, У: П Яп. Тогда матрица ковариации векторов Х,У:Ъ = соу(Х, У) = Е[(Х - ЕХ)(У - ЕУ)Т].
В нашем случае: X = У, тогда I называется матрицей ковариации вектора X и обозначается cov(X). Такая матрица ковариации является обобщением дисперсии для многомерной случайной величины, а ее след — скалярным выражением дисперсии многомерной случайной величины [12]. Собственные векторы и собственные числа этой матрицы позволяют оценить размеры и форму облака распределения такой случайной величины, аппроксимировав его эллипсоидом [13] (или эллипсом в двумерном случае). Е - невырожденная, неотрицательно определённая, симметричная матрица.
Пусть дана выборка случайного вектора X, состоящая из векторов: {X¿}£=1. -Еели-елучайнь1Й-вектор-распределён-нормалБно-Аг-~^(7ггЕ)^тогда"выборочньш' вектор математического ожидания и выборочная матрица ковариации [11] могут быть получены из соотношений:
II = > 2 = - № - ■ (2)
Двумерное нормальное распределения с параметрами I = 4) = (2) пРед~ ставлено на рисунке 2.
Рис. 2. Функция плотности двумерного нормального распределения
Значения пикселя, взятого из статичной области кадра на протяжении небольшого отрезка времени, часто колеблются около некоторого среднего значения. На это свойство опираются многие алгоритмы, строящие модель фона [1424]. Эти колебания могут быть обусловлены как шумом камеры, так и качественными изменениями, происходящими в снимаемой сцене (например, скачки освещения). Так же в пикселе может происходить процесс смены этого среднего уровня, после чего колебание значения пикселя стабилизируются у нового уровня. Интенсивность пикселя с фиксированными координатами х и у в потоке кадров может быть описана с помощью некоторой случайной величины. При этом если пиксель берётся из статичной области кадра, где нет движения, то можно предполагать что функция плотности распределения будет иметь один или несколько экстремумов. Очевидно, что такая случайная величина может быть описана нормальным законом распределения [10].
Значения пикселей изображений описываются тремя цветовыми составляющими, т.е. изменения в пикселе фона можно описывать с помощью трёхмерной случайной величины. Этот случайный вектор можно задать с помощью трёхмерного нормального распределения.
В начале работы 8вМ алгоритма, строящего простую вероятностную модель снимаемой сцены, выбирается начальный вектор средних значений и матрица ковариаций для каждого пикселя моделируемого фона. Модель фона или просто фон имеет такой же размер, что и кадры. Фон, в отличие от базового кадра,
является динамическим и значения его пикселей совпадают с векторами средних значений. В алгоритме простого вычитания фона (BBS) поступающие кадры сравнивались со статичным базовым кадром, который выбирался из видеопоследовательности так, что бы на нём не было движущихся объектов. А в SGM алгоритме вместо базового кадра используется динамическая модель фона снимаемой сцены. Эта модель фона строится таким образом, чтобы в неё не попадали движущиеся объекты. Это достигается тем, что каждому пикселю в модели фона сопоставляется трёхмерное нормальное распределение, т.е. сопоставляется вектор средних значений и матрица ковариации, причём текущие значение интенсивности пикселя в модели фона совпадает с вектором средних значений. Пиксели поступающих кадров сравниваются с соответствующими пикселями в модели фона, и оцениваются как принадлежащие фону или принадлежащие движущемуся объекту. При таком сравнении используются вектор средних значений и матрица ковариации, сопоставленные пикселям из модели фона, и вектор цветовых значений пикселя обрабатываемого кадра. После сравнения всех пикселей кадра с моделью фона, получаем бинарную маску движения. Затем обновляются все пиксели фона, т.е. обновляются вектора средних значений и матрицы ковариаций, соответствующие пикселям фона. Модель фона обновляется с использованием значений пикселей текущего кадра. В общем случае обновление пикселей фона (т.е. обновление/адаптация вектора средних значений и матрицы ковариаций) происходит в зависимости от того как были классифицированы пиксели текущего кадра. Затем происходит обработка следующего кадра: строится маска движения и обновляется -модель-фона^--
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Технология подготовки изображений лиц к распознаванию личности в видеопотоке в режиме реального времени на основе компенсации ракурса и трекинга лиц2017 год, кандидат наук Небаба Степан Геннадьевич
Разработка и исследование метода матричного маскирования видеоинформации в глобально распределенных системах2018 год, кандидат наук Чернышев Станислав Андреевич
Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных2013 год, кандидат технических наук Рубина, Ирина Семеновна
Метод и алгоритмы обнаружения и сопровождения подвижных объектов на видеопоследовательности2023 год, кандидат наук Тарасов Андрей Сергеевич
Исследование способов компенсации движения в цифровых динамических видеоизображениях2015 год, кандидат наук Калистратов, Дмитрий Сергеевич
Список литературы диссертационного исследования кандидат наук Шелабин, Дмитрий Алексеевич, 2013 год
Литература и ссылки
1. Шелабин Д.А., Севрюков С.Ю. Разработка прототипа системы обнаружения подвижных объектов в видео-потоках // Процессы управления и устойчивость: Труды 40-й научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова, Г.Ш. Тамасяна. - СПб.: Изд-во СПбГУ, 2009. С. 536-541.
2. Шелабин Д.А. SGM алгоритм обнаружения объектов в видеопотоке // Процессы управления и устойчивость: Труды 41-й международной научной конференции аспирантов и студентов / Под ред. Н. В. Смирнова, Г. Ш. Тамасяна. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2010. С. 516-522.
3. Jorge P.M., Abrantes A.J., Marques J.S. On-line object tracking with Bayesian networks. // IEEE ICIP, 2002.
4. Staujfer Chris, Grimson W. Eric L. Learning patterns of activity using real-time tracking // IEEE Trans. PAMI, Vol. 22(8), pp. 747-757, 2000. http://people.csail.mit.edu/stauffer/ /Home/_papers/vsam-pami-tracking.pdf (дата обращения 09.03.2012).
5. Nascimento J., Marques J.S. Performance evaluation for object detection algorithms for video surveillance // IEEE Transaction on Multimedia, V8.4, 2006 pp: 761 - 774.
6. Гаганов В., Конушин А. Сегментация движущихся объектов в видео поток // Сетевой журнал: компьютерная графика и мультимедиа. http://cgm.computergraphics.ru/content/view/67 (дата обращения 09.03.2012).
7. Haritaoglu /., Harwood D., DavisL. S. W4: real-time surveillance of people and their activities // IEEE Trans. Pattern Anal. Machine Intell., vol. 22, no. 8, pp. 809-830, August 2000.
8. Wren C. R., Azarbayejani A., Darrell Т., Pentland A. P. Pfinder: Real-time tracking of the human body // IEEE Trans. Pattern Anal. Machine Intell., vol. 19, no. 7, pp. 780-785, July 1997.
9. Кендалл M., Стюарт А. Теория распределений. - M.: Наука. 1966.- 566 с.
10. Боровков А.А. Теория вероятностей: Учеб. пособие для вузов.— 2-е изд., перераб. и доп.— М.: Наука. Гл.ред. физ.-матлит. 1986.— 432 с.
11. Ширяев А.Н. Вероятность. М. Наука, 1980.
12. Боровков А. А. Числовые характеристики случайных величин // Теория вероятностей. — 5-е изд. — М.: Либроком, 2009. — С. 93-94. — 656 с.
13. Гантмахер Ф. Р. Теория матриц. — М.: Наука, 1966. — 576 с.
14. Moore D. A real-world system for human motion detection and tracking, Undergraduate Thesis, May 2003.
15. Butler D.E., Bove Jr. V.M., Sridharan S. Real-time adaptive background segmentation. // EURASIP Journal on Applied Signal Processing Volume 2005, 2005, Issue 14, pp. 22922304.
16. Elgammal A. M., Harwood D., Davis L. S. Non-parametric model for background subtraction. // ECCV '00: Proceedings of the 6th European Conference on Computer Vision-Part II, 2000, pp.
17. Grimson W.E.L. Stauffer С, Romano R., Lee L. Using adaptive tracking to classify and monitor activities in a site. // Computer Vision and Pattern Recognition 1998 (CVPR98), Santa Barbara, CA. 1998.
18. Horn В. K. P. Robot Vision. // The MIT Press, pp. 66-69, 299-333. 1986.
19. Haritaoglu, Ismail, HarwoodD., Davis L.S. W4: A real time system for detecting and tracking people. // Third International Conference on Automatic Face and Gesture Recognition, Nara, Japan. 1998.
20. Horswill, Yamamoto M. A active stereo vision system. // IEEE/LAP Workshop on Visual Behaviors, Seattle. 1994.
21. Horswill, I. Visual routines and visual search: A real-time implementation and automata-theoretic analysis. // IJCAI, 1995.
22. Zivkovic Z. Improved adaptive Gaussian mixture model for background subtraction. // Proceedings of the Pattern Recognition, 17th International Conference on (ICPR'04) Volume 2, 2004, pp. 28-31
23. Young S., Forshaw M., Hodgetts M. Image comparison methods for perimeter surveillance. - University College London Image Processing Group. - 1999. - URL: http://ipga.phys.ucl.ac.uk/reports/index.html (дата обращения 09.03.2012).
24. Ohta N. A statistical approach to background suppression for surveillance systems. // Proceedings of IEEE Int. Conference on Computer Vision, 2001, pp. 481-486.
25. Боровков А.А. Математическая статистика: оценка параметров, проверка гипотез. -М., Физматлит, 1984. - 472 с.
26. Мишулина О.А. Статистический анализ и обработка временных рядов. — Москва.: МИФИ, 2004. —С. 180.
27. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.
28. Грешилов А. А., Стакун В. А., Стакун А. А. Математические методы построения прогнозов. — М.: Радио и связь, 1997.- 112 с.
29. Сергиенко А.Б. Цифровая обработка сигналов. СПб.: Питер, 2003 - 604 с.
30.Айфичер Э.С., Джервис Б.У. Цифровая обработка сигналов: практический подход. 2004 г.
31. Прэтт У. Цифровая обработка изображений: Пер. с англ. М.: Мир, 1982.
32. Оппенгейм А., Шафер Р. Цифровая обработка сигналов. Изд. 2-е, испр. — М.: «Техносфера», 2007. — 856 с.
33. Л.Шапиро, Дж.Стокман. Компьютерное зрение, изд. — М.: БИНОМ. Лаборатория знаний, 2006. — 752 с.
34. Д.Форсайт, Ж.Понс. Компьютерное зрение. Современный подход, изд. — М.: Вильяме, 2004. — 928 с.
35. Jiang С., Ward М.О. Shadow identification. // Proceedings of IEEE Int'l Conference on Computer Vision and Pattern Recognition, pp. 606-612, 1992.
36. Stauder J., Mech R., Ostermann J. Detection of moving cast shadows for object segmentation. // IEEE Transactions on Multimedia, vol. 1, no. 1, pp. 65-76, 1999.
37. Gonzalez R. С., Woods R. E. Digital Image Processing. Prentice Hall, 2002.
38. PratiA., Mikic I., Grana C., Trivedi M. M. Shadow detection algorithms for traffic flow analysis: a comparative study.
39. Cucchiara R., Grana C., Piccardi M., Prati A. Detecting moving objects, ghosts and shadows in video streams. // IEEE Trans.Pattern Anal. Machine Intell., vol. 25, no. 10, pp. 1337-1342, 2003.
40. Демин А. Ю. Компьютерная графика : электрон, учеб. пособие / А. Ю. Дёмин, А. В. Кудинов. - Томск : ТПУ, 2005. - URL: http://compgraph.ad.cctpu.edu.ru/index.html (дата обращения 09.03.2012).
41. Шикин Е. В., Боресков А. В. Компьютерная графика. Полигональные модели. - М.: ДИАЛОГ-МИФИ, 2000. - 464 с.
42. Вежневец А. Выделение связных областей в цветных и полутоновых изображениях. // Компьютерная графика и мультимедиа. Выпуск №1(5)/2003.-URL: http://cgm.computergraphics.ru/content/view/53 (дата обращения 09.03.2012).
43. Jorge P., Marques J., Abrantes A. On-line tracking groups of pedestrians with Bayesian networks. // Proc. Workshop on Performance Evaluation of Tracking and Surveillance, 2004.
44. Abrantes A. J., Marques J. S. J., Lemos M. Long term tracking using bayesian networks. // Proc. of IEEE Int. Conf. on Image Processing. Rochester, pp. 609-612.
45. Ayers D., Shah M. Monitoring human behavior from video taken in an office environment // Image and Vision Computing 19(12), 833-846.
46. McKenna S., Jabri S., Duric Z, Rosenfeld A., Wechsler H. Tracking Groups of People // Journal of CVIU, 80, pp. 42-56, 2000.
47. Cox I., Hingorani S. An efficient implementation of reid's multiple hypothesis traking algorithm and its evaluation for the propose of visaul traking. // IEEE Trans. On Pattern Analysis and Machine Intelligence, 18(2): 138-150, 1996.
48. Тулупьев A. Л., Николенко С. К, Сироткин А. Л. Байесовские сети Логико-вероятностный подход // Под общей редакцией Юсупова Р. М. Санкт-Петербург: Наука, 2006.
49. Kevin P. Murphy A brief introduction to graphical models and bayesian networks. 1998. URL: http://www.cs.ubc.ca/~muфhyk/Bayes/bnintro.html
50. Ben-Gal I. Bayesian networks // Encyclopedia of Statistics in Quality and Reliability John Wiley \& Sons. 2007. URL: http://www.eng.tau.ac.il/~bengal/BN.pdf
51. Стюарт Рассел, Питер Норвиг Искусственный интеллект: современный подход (AIMA): [пер. с англ.]. — 2-е изд.. — М.: Вильяме, 2005. — 1424 с.
52. Bishop Christopher М. Graphical models // Pattern Recognition and Machine Learning. — Springer. — P. 359-422.
53. Шелабин Д.А. Классификация объектов движения с использованием байесовских сетей // Вестник СПбГУ. Серия 10. Выпуск 1. Санкт-Петербург. 2012.
54. Гончаров М. Модифицированный древовидный алгоритм Байеса для решения задачи классификации // Spellabs IT company. 2007. URL: http ://www. spellabs .ru/download/AugmentedNaiveBay es .pdf
55. Cohen I., Medioni G. Detecting and tracking moving objects for video surveillance // IEEE Proc. Computer Vision and Pattern Recognition, Fort Collins, 1999, pp. 1-7.
56. Collins R. A System for video surveillance and monitoring: VSAM Final Report // CMU technical report, 2000.
57. Darwiche Adnan Modeling and reasoning with bayesian networks. — Cambridge University Press, 2009. — 526 p.
58. Jorge P.M., Jorge S.M., Abrantes A.J. Estimation of the bayesian network architecture for object tracking in video sequences. // ICPR (2), pp. 732-735, 2004.
59. Bar-Shalom Y., Fortmann T. Tracking and data association, Academic Press, 1998.
60. Афанасьев B.H., Юзбашев M.M. Анализ временных рядов и прогнозирование.— М.: Финансы и статистика, 2001.
61. Журавлев Ю. И., Рязанов В. В., Сенъко О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: Фазис, 2006.
62. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999.
63. Килъдишев Г. С., Френкель А. А. Анализ временных рядов и прогнозирование. М.: «Статистика» 1973.
64. Шелабин Д.А. Трассировка и прогнозирование перемещения движущихся объектов в видеопотоке // Современные проблемы науки и образования. - 2013. - №2; URL: www.science-education.ru/108-9107 (дата обращения: 19.05.2013).
65. Орлов А. И. Принятие решений. Теория и методы разработки управленческих решений. — М.: МарТ, 2005. — 496 с.
66. Литвак Б. Г. Экспертные оценки и принятие решений.- М.: Патент, 1996. — 271 с.
67.Дюран Б., Оделл П. Кластерный анализ. М.: «Статистика» 1977.
68. Ким Дж.О., Мьюллер Ч. У, Клекка У. Р. Факторный, дискриминантный и кластерный анализ. М.: «Финансы и статистика» 1989.
69. Шелабин Д.А., Сергеев СЛ. Процесс трассировки движущихся объектов в видеопотоке // Актуальные проблемы гуманитарных и естественных наук. Москва. — 2013. — №7.-С. 71-77
70. Набор тестов Performance Evaluation of Tracking and Surveillance (PETS): ftp://pets2001 .cs.rdg.ac.uk
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.