Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей тема диссертации и автореферата по ВАК РФ 01.04.03, кандидат физико-математических наук Булыгин, Алексей Владимирович
- Специальность ВАК РФ01.04.03
- Количество страниц 205
Оглавление диссертации кандидат физико-математических наук Булыгин, Алексей Владимирович
Введение.
1. Принципы кодирования источника сигнала в информационных радиотехнических системах.
1.1. Радиосистемы передачи мультимедийной информации.
1.1.1. Обобщенная структура системы передачи информации.
1.1.2. Инфомационные объемы мультимедийных приложений.
1.1.3. Современные системы передачи информации и их характеристики.
1.2. Существующие стандарты сжатия видео.
1.2.1. Принципы кодирования видеоизображений.
1.2.2. Семейство стандартов MPEG.
1.2.3. Семейство стандартов Н.26х.
1.3. Ортогональные преобразования сигналов и полей.
1.3.1. Ортогональное и биортогональное векторное преобразование сигналов.
1.3.2. Полиномиальное преобразование.
1.3.3. Дискретные преобразования сигналов DCT и Wavelet.
1.3.4. Дискретное чебышевское преобразование GDCT.
1.4. Структура и свойства спектров сигналов и полей.
1.5. Принцип видеокодирования MGDCT.
1.5.1. Особенности системы видеокодирования MGDCT.
1.5.2.Этапы кодирования MGDCT.
2. Синтез и анализ многоальтернативного обнаружения изменений поля.
2.1. Постановка задачи обнаружения: модели изменений.
2.2. Синтез блочных спектральных алгоритмов обнаружения изменений поля.
2.2.1. Оптимальные алгоритмы.
2.2.2. Квазиоптимальные алгоритмы.
2.3. Характеристики многоальтернативного обнаружения изменений в блоках.
2.3.1. Вероятности ошибочных решений при двух гипотезах.
2.3.2. Вероятности ошибок в многоальтернативном случае.
2.4. Экспериментальное исследование характеристик обнаружения изменений в блоках.
2.5. Алгоритм обнаружения изменений на основе сегментации поля.
3. Анализ информационных и статистических характеристик сигналов и полей на основе спектрального описания.
3.1. Информационное описание полей в спектральном представлении
3.2. Внутриблочная корреляция спектров при непрерывных ортогональных преобразованиях.
3.2.1. Спектральное разложение случайного поля в обобщенные ряды Фурье.
3.2.2. Корреляция спектральных коэффициентов при разложении по базису с неограниченной областью определения.
3.2.3. Корреляция спектральных коэффициентов при разложении по базису с ограниченной областью определения.
3.3. Межблочная корреляция спектральных коэффициентов при непрерывных ортогональных преобразованиях.
3.4. Корреляция спектральных коэффициентов при дискретных преобразованиях.
3.4.1. Моменты и межблочная корреляция нулевой спектральной моды при DCT преобразовании.
3.4.2. Моменты и внутриблочная корреляция ненулевых спектральных мод при DCT преобразовании.
3.4.3. Межблочная корреляция одноименных спектральных мод при DCT преобразовании.
3.5. Расчет и экспериментальное исследование энтропии спектра двумерного поля.
4. Обнаружение и оценка структурного подобия декодированных изображений.
4.1. Современные объективные критерии структурного подобия.
4.2. Исследование энтропии и структурного подобия декодированных изображений.
4.3. Непараметрические критерии структурного подобия.
4.4. Исследование структурного подобия при наличии искажений.
4.4.1. Структурное подобие при наличии импульсных помех.
4.4.2. Структурное подобие при наличии квазигауссовских помех.
4.4.3. Структурное подобие при наличии блочности.
4.4.4. Структурное подобие при наличии размытости.
4.4.4. О возможности использования критериев структурного подобия для обнаружения смены сцен.
Рекомендованный список диссертаций по специальности «Радиофизика», 01.04.03 шифр ВАК
Статистические методы сжатия, восстановления и обработки сигналов в информационных системах2004 год, доктор физико-математических наук Радченко, Юрий Степанович
Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях2013 год, кандидат наук Миляев, Сергей Владимирович
Исследование и разработка методов и устройства внутрикадрового сжатия изображений2001 год, кандидат технических наук Некрасов, Петр Львович
Разработка алгоритмов стабилизации и компрессии изображений для систем видеонаблюдения мобильных робототехнических комплексов2008 год, кандидат физико-математических наук Коплович, Евгения Александровна
Разработка и исследование высокоэффективных систем цифровой обработки динамических изображений и оценки ее качества2007 год, доктор технических наук Дворкович, Александр Викторович
Введение диссертации (часть автореферата) на тему «Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей»
Актуальность работы. Современные системы передачи данных функционируют в условиях, когда все возрастающие потоки данных необходимо передавать по каналам, пропускная способность которых ограничена действующими стандартами на частотные диапазоны, электромагнитной совместимостью, наличием помех.
Большую часть всей передаваемой информации в настоящее время занимает мультимедиа контент, наиболее весомой частью, которого является видео изображения. Этот факт, показывает важность и необходимость совершенствования и постоянного развития технологий сжатия именно мультимедийных данных и в особенности динамических изображений. Для этого разработаны стандарты сжатия видео МРЕ01-4, Н.261-264. Наиболее совершенные кодеки МРЕО-4, Н.264 / АУС являются эффективными по критерию коэффициента сжатия видеопотока — качество восстановленного видео, но весьма сложными в алгоритмическом и вычислительном плане. Соответственно, телекоммуникационные устройства, использующие данные стандарты сжатия, предъявляют высокие требования к процессорам видеообработки, обладают повышенным энергопотреблением. Поэтому они не могут быть использованы, например, в мобильных и автономных устройствах передачи или хранения видеоинформации.
Основным недостатком существующих алгоритмов сжатия является способ кодирования видео, основанный на оценке векторов сдвига фрагментов изображения от кадра к кадру, предсказание текущего кадра по предыдущим кадрам и преобразования ошибки рассогласования с помощью дискретного косинусного преобразования (ДКП). Данный принцип кодирования в целом достиг предела своих возможностей. Еще одной особенностью существующих алгоритмов сжатия видео является их детерминированный характер, поскольку они разработаны без учета влияния 1 помех на обрабатываемое изображение. Поэтому возникает необходимость в разработке новых принципов пространственно-временной обработки зарегистрированных оптических полей, сочетающих достаточную вычислительную простоту с эффективным удалением информационной избыточности в видеопотоке и устойчивостью к наличию помех. Данная задача, во-первых, может решаться путем использования новых видов ортогональных преобразований, отличных от ДКП. Во-вторых, синтез алгоритмов должен основываться на методах статистической теории принятия решений, приводящих к оптимальным алгоритмам. Причем данные алгоритмы должны быть устойчивыми к помехам различной природы и априорной неопределенности относительно характеристик обрабатываемых полей. В-третьих, должны быть разработаны методы статистического и информационного анализа новых алгоритмов обработки, сжатия и восстановления динамических изображений (видеопоследовательностей).
Таким образом, недостатки существующих алгоритмов обработки и сжатия динамических изображений и необходимость применений новых принципов видеокодирования требуют решения указанных задач.
Цель работы. Целью работы является синтез и анализ спектральных алгоритмов многоальтернативного обнаружения изменений в зарегистрированных полях (видеопоследовательностях), разработка методов расчета количества информации в изображении на основе анализа спектров, обнаружение и оценка изменений в последовательности изображений с нечеткой математической моделью (структурное подобие). Для реализации этой цели в диссертации поставлены и решены следующие задачи:
1. Синтез алгоритмов многоальтернативного обнаружения изменений в блоках видеопоследовательности на основе обобщенного спектрального описания с учетом различной априорной информации об обрабатываемом изображении.
2. Разработка методов анализа и получения расчетных соотношений для характеристик многоальтернативного обнаружения изменений в динамических изображениях, а также экспериментальная проверка предложенных алгоритмов и методов анализа их эффективности.
3. Исследование статистических характеристик спектральных мод обобщенных рядов Фурье и дискретного спектрального преобразования гауссовских случайных полей и разработка, на основе проведенного анализа, метода расчета количества информации и предела сжатия в изображении.
4. Разработка алгоритмов обнаружения и оценка изменений в динамических изображениях с неопределенными статистическими характеристиками и нечеткой математической формами - критериев структурного подобия и их экспериментальное исследование.
5. Установление методами статистического моделирования и натурных экспериментальных исследований границ применимости расчетных соотношений.
6. Разработка рекомендаций по алгоритмической структуре и рабочим параметрам для перспективного принципа видеокодирования МСГОСТ, совместимого с кодированием на основе дискретного косинусного преобразования.
Методы проведения исследований. При решении поставленных задач в диссертации используются методы статистической радиофизики, математического анализа, теории вероятностей, математической статистики и случайных процессов, теории статистических решений. При экспериментальных исследованиях использовались реальные видеопоследовательности. При разработке пакета прикладных программ активно * использовались методы объектно-ориентированного программирования на языке С++, а также процедурное программирование в пакете МаШсас!.
Научная новизна работы. В данной работе получены новые результаты:
1. Синтезирован блочный спектральный алгоритм многоальтернативного обнаружения изменений в последовательности изображений, и исследована его реализация на основе дискретного чебышевского (ОБСТ) и дискретного косинусного преобразований.
2. Получены вероятностные характеристики при попарной проверке гипотез: а) нет изменений в блоке; б) изменения, связанные со сдвигом изображения; в) смена сюжета; г) пропадание блока - в спектральных алгоритмах обработки видеопоследовательности, в том числе при использовании части спектральных коэффициентов. Показано, что характеристики устойчивы к выбору порогов.
3. Предложен алгоритм обнаружения изменившихся фрагментов последовательности кадров на основе их статистической сегментации. Алгоритм основан на анализе временных корреляционных матриц каждого пространственного отсчета поля и не требует знания их законов распределения.
4. Получены корреляционные характеристики спектральных мод обобщенных рядов Фурье и дискретного косинусного преобразования гауссовских полей. Найдены внутриблочные и межблочные корреляционные моменты для спектральных коэффициентов и определены условия, когда корреляция пренебрежимо мала.
5. Разработан метод расчета количества информации (энтропии) цветного изображения на основе спектрального подхода.
6. Проведена экспериментальная проверка работоспособности синтезированных алгоритмов и методов их анализа, а также способов расчета энтропии изображения.
7. Предложены непараметрические алгоритмы обнаружения изменений в полях (изображениях) с неизвестной статистикой (структурой) и нечеткой математической формализацией.
В. Даны рекомендации по алгоритмической структуре и рабочим параметрам нового перспективного принципа видеокодирования МвБСТ.
Основные положения и результаты, выносимые на защиту. На защиту выносятся следующие результаты, впервые полученные в данной работе.
1. Блочные спектральные алгоритмы многоальтернативного обнаружения изменений в динамических изображениях, устойчивые к заданию порога принятия решения.
2. Теоретические и экспериментальные характеристики проверки гипотез о виде изменений в блоках изображений, учитывающие конечное число спектральных мод в решающих статистиках.
3. Новый алгоритм статистической сегментации изменяющихся фрагментов динамических изображений, не требующий знания законов распределения отсчетов поля.
4. Расчетные соотношения для внутриблочной и межблочной корреляции спектральных коэффициентов разложения поля в обобщенные ряды Фурье, позволяющие определить условия, при которых корреляцией можно пренебречь.
5. Методика расчета энтропии цветного (RGB) изображения на основе его спектрального анализа, экспериментальное подтверждение вывода о том, что чебышевское преобразование GDCT лучше удаляет информационную избыточность при сжатии изображений, чем классическое дискретное косинусное преобразование при соизмеримом качестве изображений.
6. Многофакторное обобщение классических метрик (PSNR др.) и новые непараметрические алгоритмы обнаружения и оценки изменений в полях с неизвестной статистической и нечеткой математической формализацией, названные непараметрическими критериями структурного подобия MNSSIM1 и MNSSIM2.
Практическая ценность. Проведенный в работе цикл теоретических и экспериментальных исследований позволил обосновать структуру и задать рабочие параметры нового перспективного видеокодека > MGDCT, обладающего хорошими характеристиками битрейт/качество в широком диапазоне скоростей, передачи информации. Предложенные спектральные алгоритмы обработки и сжатия видеопоследовательностей просты в реализации, устойчивы к воздействию помех и искажений, а также к априорной неопределенности вида и свойств изображений. Результаты исследований внедрены в ОКР ЗАО «Кодофон».
Достоверность. Достоверность результатов, полученных в диссертационной работе, подтверждается корректностью использования математического аппарата, совпадением новых результатов с известными, результатами статистического моделирования и экспериментальными исследованиями на реальных видеопоследовательностях.
Апробация работы. Результаты исследований, приведенные в данной диссертации, были представлены в виде докладов и обсуждались на:
- VIII, IX, X, XI и XII Международных конференциях «Цифровая обработка сигналов и ее применения - DSPA», Москва, 2006, 2007, 2008, 2009, 2010.
- XII, XIII, XIV Международных научно-технических конференциях «Радиолокация, навигация и связь», Воронеж, 2006, 2007, 2008.
- VII Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций», Самара, 2006.
- XI Международной научно-технической конференции «Кибернетика и высокие технологии XXI века», Воронеж, 2010.
Публикации. По теме исследования опубликовано 14 печатных работ, из них 3 — в журналах, рекомендованных ВАК к защите диссертации.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, приложения и списка литературы.
Похожие диссертационные работы по специальности «Радиофизика», 01.04.03 шифр ВАК
Исследование и разработка адаптивных методов и устройства цифрового сжатия и восстановления спектра телевизионных изображений2004 год, кандидат технических наук Черноглазов, Александр Геннадьевич
Методы и алгоритмы локально-адаптивной обработки сигналов и изображений2004 год, доктор технических наук Кобер, Виталий Иванович
Разработка методов и устройств компенсации пространственно-временных искажений в системах цифрового телевидения2008 год, кандидат технических наук Поляков, Дмитрий Борисович
Модели, методы и алгоритмы кодирования изображений в устройствах систем на кристалле2011 год, доктор технических наук Фахми, Шакиб Субхиевич
Разработка быстродействующих алгоритмов компрессии видеоданных с использованием дельта-преобразований второго порядка2005 год, кандидат технических наук Погорелов, Константин Владимирович
Заключение диссертации по теме «Радиофизика», Булыгин, Алексей Владимирович
Результаты исследования приведены в таблице 4.3.1. Столбец «Параметр шума» характеризует интенсивность р зашумления изображения. Столбец «Тип шума» характеризует тип зашумления: «п» - «перец» изображение зашумляется черными точками, «с» - «соль» изображение зашумляется белыми точками, «п-с» - «перец-соль» изображение зашумляется и белыми и черными точками.
Рис. 4.4.4. Изображение «Лена», шум - "перец",/? = 0,2.
Как видно из таблицы 4.4.1 при одинаковом значении параметра шума, мы имеем различные значения критерия MS SIM. Например, при параметре шума р = 0,2 изображение зашумленное белыми точками имеет значение MS SIM почти на треть меньшее, чем при таком же значении параметра шума и зашумлении черными точками. Визуально такие изображения тоже кажутся разного качества, в чем можно убедиться, обратившись к рисункам 4.4.4, 4.4.5.
Рис. 4.4.5. Изображение «Лена», шум - "соль",/? = 0,2.
М881М = 0,196.
На рисунке 4.4.6 представлены зависимости значениев критериев М881М, МЫ881М1, МЫ881М2, МЕ881М от параметра интенсивности импульсного шума р.
Практически во всем диапазоне изменений р значения МТЧ881М1 и МЫ881М2 близки между собой и имеют значения более близкие к восприятию зрительной системы человека.
Таким образом, при исследовании влияния искажений в виде импульсного шума следует отдать предпочтение модифицированным критериям МЫ881М1 и МЫ881М2 [65].
1,00 0,70 0,40 0,10 -0,20 -0,50
--и—
0,05
0,2 а) Тип импульсного шума «соль».
-в— МвЭМ -^-МЫ331М1 —е— МЫЭЭШ -В-МЕ331М б) Тип импульсного шума «перец».
0,4 в) Тип импульсного шума «соль/перец». Рис.4.4.6. Зависимость значений критериев М881М, М^БПУП, МЫ881М2,
МЕ881М от интенсивности импульсного шума и типа шума.
4.4.2. Структурное подобие при наличии квазигауссовских помех Прежде всего, уточним понятие квазигауссовской помехи на цифровом изображении. Каждая из цветовых компонент RGB принимает о значение от 0 до 2 - 1 = 255 при целочисленном 8-битном представлении уровней сигнала. Поэтому каждая цветовая RGB компонента при наличии квазигауссовской помехи формировалась по закону у^Ху + Ест-л^ + г7, где Г)у ~ N(0, 1) - независимые гауссовские величины для каждого пикселя изображения с координатами (i, j); ст - нормирующий коэффициент, ст < 1; [•] - означает целую часть числа (•).
5 7
Нормирующий коэффициент 2 = 32 и смещение 2 =128 выбирались из расчета, чтобы результирующие значения с вероятностью Р = 0.995 попадали в интервал 0 < У,, < 255. Если результирующее значение выходило за границы этого интеврала, то есть Уу < 0 или Уу < 255, то производилось округление до Уу = 0 или Уу = 255 соответственно.
В качестве тестовых использовались изображения из базы данных изображений Laboratory for Image and Video Engineering [49]. Из указанной базы данных были использованы и значения субъективной оценки качества изображений DMOS [58]. Для зашумленных гауссовым шумом изображений были рассчитаны значения критериев MSSIM, MESSIM, MNSSIM1, MNSSIM2 и ранговые коэффициенты корреляции Спирмена между ними и значениями DMOS.
Коэффициент корреляции Спирмена определяется формулой (4.3.3):
6-Sd? Р=1—ц—.
Здесь п — число элементов в последовательности {х',}.
Значения р изменяются от -1 до 1, причем р = 0 указывает на отсутствие корреляции.
Ранговая корреляция признается значимой при [15] значениях коэффициента корреляции Спирмена р: р| > ра или S > Sa, (4.4.1) где ра и Sa - критические значения, равные при п > 10:
2" 0 0 i=l i=l ua - a-квантиль стандартного нормального распределения. Подсчет ранговых коэффициентов корреляции Спирмена между критериями MSSIM, MESSIM, MNSSIM1, MNSSIM2 и значениями DMOS осуществлялся следующим образом. Вычисленным значениям критериев MSSIM, MESSIM, MNSSIM1, MNSSIM2 присваивались ранги, также ранги были выставлены соответствующим значениям DMOS. После этого вычислялось значение коэффициента корреляции Спирмена по формуле (4.3.3). Для всех критериев качества и соответственно значений DMOS число элементов в последовательности п было равным 49. Также для каждого критерия качества MSSIM, MESSIM, MNSSIM1, MNSSIM2 было проверено выполнение условия значимости (4.4.1) для полученных коэффициентов корреляции.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.