Исследование способов компенсации движения в цифровых динамических видеоизображениях тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат наук Калистратов, Дмитрий Сергеевич
- Специальность ВАК РФ05.12.04
- Количество страниц 119
Оглавление диссертации кандидат наук Калистратов, Дмитрий Сергеевич
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ИССЛЕДОВАНИЕ СУЩЕСТВУЮЩИХ СПОСОБОВ КОМПЕНСАЦИИ ДВИЖЕНИЯ В ЦИФРОВЫХ ДИНАМИЧЕСКИХ ВИДЕОИЗОБРАЖЕНИЯХ
1.1 Обзор принципов построения цифровой телевизионной системы
1.2 Анализ обобщённой архитектуры видеокодека
1.3 Выявление особенностей способов компенсации движения
1.4 Выбор аналогичных моделей видеокодеков
1.5 Детальный обзор аналогичных способов компенсации движения
1.6 Выводы по главе
ГЛАВА 2. РАЗРАБОТКА УЛУЧШЕННОГО СПОСОБА КОМПЕНСАЦИИ ДВИЖЕНИЯ В ЦИФРОВЫХ ДИНАМИЧЕСКИХ
ВИДЕОИЗОБРАЖЕНИЯХ
2.1 Формирование теоретической основы способа
2.2 Построение математической модели способа
2.3 Синтез архитектуры видеокодека
2.4 Оценка эффективности способа
2.5 Детальный обзор разработанного способа
2.6 Выводы по главе
ГЛАВА 3. РАСШИРЕНИЕ РАЗРАБОТАННОГО СПОСОБА КОМПЕНСАЦИИ ДВИЖЕНИЯ ПРИМЕНИТЕЛЬНО К ОБЛАСТИ
СТЕРЕОВИДЕОКОДИРОВАНИЯ
3.1 Расширение теоретической основы способа
3.2 Дополнение математической модели способа
33 Модификация архитектуры видеокодека
3.4 Оценка эффективности расширенного способа
3.5 Детальный обзор расширенного способа
3.6 Выводы по главе
ГЛАВА 4. СТРУКТУРНЫЙ СИНТЕЗ И СРАВНИТЕЛЬНЫЙ АНАЛИЗ
МОДЕЛЕЙ ВИДЕОКОДЕКОВ НА БАЗАХ АНАЛОГИЧНЫХ И РАЗРАБОТАННЫХ СПОСОБОВ КОМПЕНСАЦИИ ДВИЖЕНИЯ В ЦИФРОВЫХ ДИНАМИЧЕСКИХ ВИДЕОИЗОБРАЖЕНИЯХ
4.1 Выбор параметров эффективности работы видеокодеков
4.2 Описание экспериментальной установки для реализации способов
4.3 Осуществление способов компенсации движения
4.4 Сравнительный анализ моделей видеокодеков
4.5 Выводы по главе
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
Приложение 1. Особые случаи компенсации движения
Приложение 2. Акты внедрения результатов работы
Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Разработка и исследование методов повышения эффективности сжатия в современных видеокодеках2018 год, кандидат наук Нгуен Ван Чыонг
Разработка новых методов анализа качества видеокодеков и оптимизация систем сжатия видеоинформации2014 год, кандидат наук Хабибуллина, Наталья Айзиковна
Видеокомпрессия на основе дискретного вейвлет-преобразования и блочной компенсации движения2018 год, кандидат наук Шаронов Игорь Олегович
Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных2013 год, кандидат технических наук Рубина, Ирина Семеновна
Разработка алгоритмов стабилизации и компрессии изображений для систем видеонаблюдения мобильных робототехнических комплексов2008 год, кандидат физико-математических наук Коплович, Евгения Александровна
Введение диссертации (часть автореферата) на тему «Исследование способов компенсации движения в цифровых динамических видеоизображениях»
ВВЕДЕНИЕ
Актуальность работы. Основной предпосылкой возникновения и развития цифрового телевидения стала возможность теоретического улучшения таких параметров эффективности телевизионных систем, как качество изображения, энергоемкость, помехоустойчивость, надежность и компактность. Поскольку обеспечение данных преимуществ потребовало значительных вычислительных затрат, практическое воплощение систем цифрового телевидения стало возможным только с появлением высокопроизводительных вычислительных устройств с высокой тактовой частотой и большими объемами памяти.
Огромный вклад в развитие цифровых телевизионных технологий внесли такие отечественные учёные, как Поляков А. Ю., Серов А. В., Безруков В.Н., Карякин В.Л.. Активным развитием способов обработки и кодирования цифровых видеоизображений заняты и зарубежные учёные, здесь наиболее значимыми являются достижения «экспертной группы по движущимся изображениям»(МРЕО-4).
Одной из ключевых и перспективных задач в области цифрового телевидения является кодирование динамических видеоизображений [1-14, 51-61]. Высокая популярность видеокодирования обусловлена возможностью передачи по каналам связи кодов малого объёма, которые ставятся в соответствие исходному развёрнутому изображению большого объёма. Устройства, обеспечивающие сжатие информации, называют видеокодеками. Однако, сильное сжатие информации сопровождается большими временными затратами, а также искажением изображений вследствие неидеальности математических преобразований цифровых видеоизображений. Иными словами, между глобальными параметрами эффективности работы видеокодеков возникают ситуации, когда при улучшении одних параметров ухудшаются другие и наоборот. В частности, актуальной является задача существенного повышения скоростных качеств моделей видеокодеков при незначительных снижениях объёмов кадровых кодов и качества декодируемых изображений применительно к областям моновидеокодирования и стереовидеокодирования.
Исходя из этого, научной задачей, решаемой в диссертационной работе, является разработка эффективных способов кодирования цифровых динамических видеоизображений и перспективных моделей видеокодеков на их основе.
Объектом исследования является видеокодек - устройство для сжатия информации, представляющее собой пару взаимодополняющих подсистем -кодера и декодера, выполняющих, соответственно, прямые и обратные преобразования видеоизображения.
Предметом исследования являются способы компенсации движения в цифровых динамических видеоизображениях.
Целью работы является повышение скоростных показателей видеокодеков на основе разработки эффективных способов компенсации движения в цифровых динамических видеоизображениях.
Поставленная цель достигается решением следующего комплекса взаимосвязанных задач:
1. Исследование существующих способов компенсации движения в цифровых динамических видеоизображениях и моделей видеокодеков на их основах.
2. Разработка улучшенных способов компенсации движения в цифровых динамических видеоизображениях.
3. Разработка перспективных моделей видеокодеков на базах указанных способов.
4. Проведение структурного синтеза и сравнительного анализа существующих и разработанных моделей видеокодеков.
Методы исследований, используемые в диссертации, включают методы математической физики [15-17], методы теории множеств [18], методы теории вероятности, методы линейной алгебры и аналитической геометрии [19,20], методы дифференциального и интегрального исчисления [21-24], методы теории обыкновенных дифференциальных уравнений [25] и теории дифференциальных уравнений в частных производных [26], а также методы компьютерного моделирования [27-30].
Основные положения, выносимые на защиту, характеризующие основные достижения диссертационной работы, состоят в следующем:
1. Результаты исследований существующих способов компенсации движения в цифровых динамических видеоизображениях и моделей видеокодеков на их основах.
2. Разработанные улучшенные способы компенсации движения в цифровых динамических видеоизображениях.
3. Разработанные прикладные модели видеокодеков на базах указанных способов.
4. Результаты сравнительного анализа существующих и разработанных моделей видеокодеков.
Научная новизна работы заключается в следующем:
1. Разработаны способы компенсации движения в цифровых динамических видеоизображениях, использующие сочетание поисковых алгоритмов компенсации движения с аппроксимацией движения кадровых проекций физическими законами движения пространственных объектов.
2. Разработаны оригинальные архитектуры перспективных моделей видеокодеков, направленные на повышение их скоростных показателей.
Практическая ценность диссертации определяется разработанными моделями видеокодеков, обеспечившими при работе в режиме реального времени существенное увеличение пропускной кадровой способности видеокодека в среднем на 10-20% на фоне незначительных снижений показателей объёмов кадровых кодов и качества декодируемых изображений в среднем на 1-2% по сравнению с существующими аналогичными моделями.
Достоверность результатов диссертационной работы определяется следующими факторами:
- количеством и результатами проведённых экспериментальных исследований;
- хорошим совпадением результатов экспериментальных исследований с теоретическими исследованиями.
Личный вклад автора. Результаты исследования получены автором лично, из них основными являются:
1. Разработанные способы компенсации движения в цифровых динамических видеоизображениях.
2. Разработанные прикладные модели видеокодеков на базах указанных способов.
Реализация результатов работы. Разработанные в ходе исследования программное средство для анализа моделей видеокодеков и комплекс лабораторных работ на его основе внедрены в учебный процесс на кафедре «Радиоэлектроника» в Тульском государственном университете. Способы обработки динамических видеосигналов, а также узлы цифровых телевизионных систем, разработанные по результатам исследований, были внедрены на предприятии ОАО Машиностроительный завод «Штамп» имени Б.Л. Ванникова для визуального контроля технологического процесса производства в режиме реального времени.
Апробация работы. Основные положения и результаты диссертационной работы докладывались на следующих конференциях: IX Всероссийская научно -техническая Интернет - конференция. Тула, 2012 г., 20-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов. «Микроэлектроника и информатика - 2013» - Москва: МИЭТ, 2013 г., XVIII Международная научно-практическая конференция - Новосибирск, 2014 г., Международная научно-практическая конференция - Уфа, 2014 г.
Основное содержание работы отражено в 20 публикациях [31-50], включающих 1 авторскую монографию, 10 статей, из них 5 - в изданиях, рекомендованных ВАК, 2 заявки о выдаче патента на изобретение, 1 свидетельство о регистрации программы для ЭВМ, 6 докладов на международных и российских НТК.
Структура и объем работы. Работа состоит из введения, четырёх разделов и заключения, изложенных на 113 страницах основного текста и содержащих 27 рисунков, 5 таблиц, списка литературы из 62 наименований.
ГЛАВА 1.
ИССЛЕДОВАНИЕ СУЩЕСТВУЮЩИХ СПОСОБОВ КОМПЕНСАЦИИ ДВИЖЕНИЯ В ЦИФРОВЫХ ДИНАМИЧЕСКИХ ВИДЕОИЗОБРАЖЕНИЯХ
В данной главе рассматривается типичная структура современной цифровой телевизионной системы, анализируется архитектура распространённых моделей видеокодеков, проводится обзор существующих способов компенсации движения в цифровых динамических изображениях и выявляются недостатки указанных способов, осуществляется выбор прототипных способов компенсации движения и моделей видеокодеков на их основах.
1.1 Обзор принципов построения цифровой телевизионной системы
Согласно проведённому анализу существующих достижений в сфере цифрового телевидения, построение современной цифровой телевизионной системы подчиняется определённому набору принципов, лежащих в основе обработки сигнала, имеющего дискретное представление. При этом исходный аналоговый сигнал представляется набором дискретных значений, взятых через определённые промежутки времени [12]. Так, аналоговое представление видеоинформации заменяется её цифровым представлением. На программном уровне значения яркостного и цветовых компонентов сигнала характеризуются набором относительных величин (целых чисел) с наперёд заданным диапазоном их изменения. Эти числа характеризуют реальные физические параметры, имеющие свои единицы измерения. Цифровое представление сигнала даёт ряд преимуществ по сравнению с его аналоговым представлением. Основные принципы построения цифровых телевизионных систем удобно наблюдать и анализировать в соответствии с их структурными схемами. Типичная структурная схема цифровой телевизионной системы (рисунок 1) показывает основные блоки
(модули) системы и взаимосвязи между этими блоками. Модульное построение системы подразумевает закрепление за каждым из блоков своих уникальных обязанностей.
Рисунок 1. Структурная схема цифровой телевизионной системы
Таким образом, модули представляются функционально-законченными структурными единицами, которые с одной стороны обособлены друг от друга, а с другой стороны служат комплектующими звеньями системы и потому выполняют задачи, поставленные перед системой в целом. По данной схеме легко проследить весь путь сигнала от первого до последнего звена.
Предварительный анализ принципов построения цифровых телевизионных систем показал, что структурную организацию современной системы можно рассматривать двояко, используя последовательный либо параллельный подход к рассмотрению структуры данной системы.
Последовательный подход к рассмотрению структуры цифровой телевизионной системы представляет её как цепь последовательных звеньев, выполняющих поочерёдные преобразования над информационным сигналом. Источник изображения выполняет функцию получения электрического оцифрованного аналога светового изображения запёчатлённой видеосцены, в зависимости от характера её освещения и динамических параметров подвижных объектов сцены, перемещения которых вызывают перераспределение характера освещения. Видеокодер выполняет функцию сжатия оцифрованной информации [2,3], ставя в соответствие исходному развёрнутому сигналу большого объёма код малого объёма. Помехоустойчивый кодер обеспечивает шумовую защиту системы от помех путём подмешивания в закодированный сигнал некоторого набора дополнительной опорно-восстановительной статистической информации, которая на стороне кодирования используется для детектирования и устранения внутренних и внешних ошибок, приобретённых в результате кодирования и передачи информации по каналу связи. Модулятор обеспечивает возможность переноса информации на высокой частоте, называемой несущей. Канал связи обеспечивает пространственный перенос входного видеосигнала, полученного от модулятора на предварительно выбранной несущей частоте. Демодулятор получает ослабленный видеосигнал, усиливает его и переводит в исходный частотный спектр. Помехоустойчивый декодер частично устраняет помехи в полученном цифровом сигнале, используя опорные статистические данные. Видеодекодер выполняет функцию развёртки закодированной информации. Приёмник изображения переводит электрическое представление сигнала в световое излучение, необходимое для человеческого восприятия.
Параллельный подход к рассмотрению структуры цифровой телевизионной системы предполагает рассмотрение данной структуры как совокупности пар
взаимодополняющих устройств, выполняющих прямые и обратные преобразования сигнала. Формирователь изображения выполняет обратимые светоэлектрические преобразования над сигналом, переводя его в вид, удобный для обработки вычислительным устройством, либо восстанавливая его к виду, требуемому для просмотра зрителем. Видеодек выполняет прямые и обратные преобразования по сжатию и развёртке информации, то есть кодирование и декодирование видеоизображений, с целью минимизации энергетических и временных затрат на передачу кодов изображений по каналу связи. Помехоустойчивый кодек обеспечивает защиту передаваемого закодированной последовательности кодов от внутренних ошибок кодирования и внешних ошибок передачи. Аналоговый преобразователь обеспечивает эффективный перенос кодового сигнала в пространстве посредством его спектральных преобразований.
Эффективность цифровых телевизионных систем, согласно имеющимся на текущий момент времени литературным источникам, обусловилась, прежде всего, появлением в их организационной структурно-элементной базе принципиально новой пары элементов: видеокодека и помехоустойчивого кодека [12]. Именно эти элементы составили основную составляющую современной цифровой телевизионной системы и привели к существенному улучшению ключевых параметров эффективности подобных систем [2]. Так, например, малые объёмы кодов обеспечили энергоэффективность данных систем, за счёт дискретных помехоустойчивых алгоритмов существенно повысилась устойчивость систем к шумовым воздействиям, вовлечение в элементный состав интегральных микросхем сделало цифровые системы компактными, а уменьшение общего числа конструктивных элементов, посредством введения микросхем, повысило также надёжность цифровых телевизионных систем. Повышение эффективности цифровых телевизионных систем является динамическим процессом, развитие которого происходит постоянно.
Классификация цифровых телевизионных систем может быть проведена по целому ряду признаков, таких как: назначение системы, структурный состав
системы, ресурсоёмкость системы и многие другие. Как правило, конечная цель использования системы определяет её основные параметры и элементную базу. Однако, по какому бы принципу не строилась очередная цифровая система, вполне очевидно, что существует определённый ряд ключевых параметров качества проектируемой системы, равно как очевидно и то, что разные модификации системы приводят к разным перераспределениям значений показателей качества работы этой системы. В этой связи, особый интерес представляет классификация цифровых систем по временному режиму работы, в числе которых выделяют файловый режим off-line и on-line режим реального времени. При этом файловые системы требовательны к объёму сжатых данных, в то время как системы реального времени критичны по отношению ко времени обработки видеоинформации. На текущий момент наибольшей актуальностью и востребованностью обладают системы реального времени, и именно они нуждаются в новых оригинальных технических решениях по повышению эффективности создания и эксплуатации данных систем.
Учитывая всё вышесказанное, можно выделить некоторые основные принципы построения современных цифровых телевизионных систем. Для обеспечения компактности и надёжности системы большинство функций возлагается на цифровые устройства. Построение и функционирование системы обычно удовлетворяет выбранным показателям её эффективности, таким как: хорошее качество изображения, малый объём передаваемой информации, помехоустойчивость системы, энергоёмкость модулирующих устройств. Каждое математическое преобразование видеосигнала является обратимым для того, чтобы входной и выходной сигналы системы в конечном итоге имели сходное представление.
1.2 Анализ обобщённой архитектуры видеокодека
Видеокодек - пара взаимодополняющих устройств - кодера и декодера, выполняющих соответственно прямые и обратные преобразования
видеоизображений [2]. При этом кодер сжимает исходные развёрнутые изображения большого объёма и ставит им в соответствие набор коротких кодов малого объёма, а декодер, наоборот, разворачивает изображения и набору полученных кодов ставит в соответствие исходные развёрнутые изображения. В процессе математических преобразований кодирования-декодирования, часть полезной информации теряется, и платой за малый объём передаваемого кода становится снижение качества декодируемого изображения. Объединение указанной пары в видеокодек весьма условно, поскольку в большинстве случаев кодер и декодер входят в составы разных устройств. Однако в целом, за видеокодеком полностью закреплена функция обеспечения информационной эффективности цифровой телевизионной системы.
Процесс разработки новых видеокодеков подчиняется определённым стандартам [2], которые представляют собой свод эффективных правил и указаний по проектированию моделей видеокодеков и в то же время оставляют для проектировщика возможность проявления гибкости в создании новых технических решений. Стандарты видеокодирования динамически обновляются и дополняются. Как правило, новый стандарт открывает целое подмножество новых версий видеокодеков с дополнением их инструментария и правил их функционирования. При этом стандарты охватывают не только область моновидеокодирования, но и область стереовидеокодирования и даже область многоракурсного кодирования.
Основная архитектурная особенность современных видеокодеков (рисунок 2), состоит в том, что на текущий момент времени наиболее широкое развитие получили видеокодеки, использующие способы кодирования, основанные на удаление временной [2], пространственной и статистической избыточности видеоинформации. Временная избыточность заключается в сходстве областей изображения в рамках последовательности из нескольких кадров. Пространственная избыточность заключается в сходстве областей изображения в рамках одного отдельно взятого кадра. Статистическая избыточность заключается в повторении предварительных кодов в динамическом информационном потоке.
s о v: tu
о *
to к
H
<т>
05 DO
П)
О
«
о
to
о «
№
Архитектура современных видеокодеков, как правило, строится таким образом, чтобы устранять все перечисленные виды избыточности. По этой же причине и связки структурных звеньев видеокодека подбираются укомплектованными временными, пространственными и статистическими звеньями в соответствии с предполагаемыми видами избыточностей видеосигнала.
Основные функциональные особенности современных видеокодеков включают три аспекта: логическое разделение единиц видеопотока на опорные кадры хорошего качества и прогнозируемые кадры менее хорошего качества с предварительным заданием периодичности следования опорных кадров; разделение кадрового изображения на подвижную динамическую и неподвижную фоновую составляющие; использование кадровой макроблочной фрагментации, согласно которой все исходные кадры разбиваются на множество мелких фрагментов, называемых макроблоками. Первая особенность обусловлена отсутствием возможности глобальной корректирующей обратной связи. Вторая особенность обусловлена тем, что нет необходимости передачи кодов изображения, достаточно лишь просигнализировать декодеру о том, что часть изображения не изменилась. Третья особенность обусловлена тем, что в процессе компенсации движения для каждого подвижного макроблока в рамках одного из ссылочных кадров ищется его наилучший макроблочный ссылочный прогноз. Для поиска данного прогноза необходимо как можно больше статистических опорных точек сличения фрагментов. То есть больший формат макроблока обеспечивает лучшую достоверность нахождения его прогноза. Большинство современных стандартов для организации новых моделей видеокодеков используют сразу все перечисленные аспекты [2].
Детальный анализ обобщённой архитектуры современных видеокодеков, в том числе с применением программных средств компьютерного моделирования и пакета, разработанных самостоятельно, прикладных программ позволил выявить следующие особенности архитектуры типичного видеокодека. Все кадры видеопотока логически разделяются на опорные и прогнозируемые, причём
опорные кадры в видеопотоке располагаются с периодичностью в несколько прогнозируемых кадров. Логическая организация кадрового потока с разделением на опорные и прогнозируемые кадры обусловлена наличием внутренних и внешних искажений видеоизображений, являющихся соответственно следствиями потери части информации в результате математических преобразований внутри кодека и влияния на передаваемый сигнал других внешних источников передачи информации при отсутствии возможности организации корректирующих глобальных обратных связей. При этом опорные кадры выступают в роли периодических коррекционных кадров видеопотока и кодируются с малыми искажениями как изображения, а прогнозируемые кадры выступают в роли динамических единиц потока и при кодировании проходят всю цепь звеньев видеокодека, включая прямые и обратные преобразования компенсации движения временными кодером и декодером. Каждый текущий кадр видеопотока разбивается на фрагменты прямоугольной формы, называемые макроблоками. Процесс обработки видеоинформации проводится на уровне таких макроблоков. Современные видеокодеки используют избирательный подход к кодированию информации, согласно которому кодируется только изменяющаяся подвижная часть изображения. Для обозначения подвижной части кадра видеокодек использует бинарную кадровую маску движения, а также признаки движения макроблоков, согласно которым каждый макроблок может признаваться внутренним, внешним или граничным по отношению к движению. При этом внутренние и граничные макроблоки можно условно объединить во множество подвижных макроблоков, то есть тех, в которых присутствует движение. Бинарная маска движения формируется в два этапа. На первом этапе начальный вид маски определяется на основе сравнений значений соответствующих пикселов в рамках текущего и предыдущего кадров. Каждый пиксел, при этом, получает статус подвижного или неподвижного пиксела. На втором этапе на основе статистического анализа проводится коррекция маски. В ходе данной коррекции для каждого пиксела по статусам его соседей корректируется собственный статус пиксела. Таким образом, неподвижный пиксел может стать
подвижным и наоборот. Вследствие такой коррекции сглаживается влияние шумовых воздействий на процесс кодирования. В целях обеспечения минимума энергетических затрат, для прогнозируемых кадров кодируются не сами исходные изображения подвижных макроблоков кадра, а разностные макроблочные остатки, координаты положений соответствующих прогнозов которых, в свою очередь, определяются векторами прогнозных смещений в рамках предыдущего ссылочного кадра, получаемыми по результатам предварительного поиска макроблочных прогнозов. При этом, для нахождения матриц макроблочного остатка какого-либо из подвижных макроблоков из исходных матриц изображения этого макроблока вычитают соответствующие матрицы его найденного макроблочного прогноза. Далее над матрицами макроблочных остатков выполняют пространственное преобразование, которое исходным остаточным матрицам ставит в соответствие массив числовых серий меньшего объёма. Ещё большее сжатие сигнала обеспечивает статистическое кодирование, которое часто повторяющимся числовым сериям и прогнозным векторам смещения ставит в соответствие короткие коды. Декодер, выполняя обратные преобразования сигнала с учётом полученных признаков движения макроблоков и по полученным кодам, восстанавливает сначала числовые серии, прогнозные векторы смещения и маски движения граничных макроблоков, а затем декодирует макроблочные остатки, после чего проводит реконструкцию компенсации движения и восстанавливает текущий кадр. При этом, для нахождения исходных матриц какого-либо из подвижных макроблоков текущего кадра значения матриц декодированного макроблочного остатка складывают со значениями соответствующих матриц макроблочных прогнозов, на которые указывают векторы смещения. В процессе обработки кадрового потока кодер и декодер хранят один и тот же набор ссылочных кадров. При обработке опорных кадров используется только пространственное и статистическое кодирование, а набор кодируемых параметров ограничивается только значениями сигналов исходных матриц макроблоков, обрабатываемых по аналогии с разностными макроблочными остатками, а все макроблоки по умолчанию считаются
подвижными. Таким образом, триада вложенных кодеков, как структурных звеньев общей модели видеокодека, обеспечивает устранение всех трёх видов избыточностей, присущих цифровым динамическим видеоизображениям.
На представленном рисунке 2, демонстрирующем архитектуру видеокодека, показаны следующие объекты кодирования-декодирования: кадры в макроблочном виде; признаки движения макроблоков с принципом классификации на внутренние, внешние и граничные, бинарные кадровые маски движения на пиксельном уровне; градация векторов смещения по принципу нулевой или ненулевой; примеры формирования разностных остатков, бинарное объёмно-информационное представление серий; а также бинарное объёмно-информационное представление кодов, которое на макроблочном уровне характеризуют истинный объём кода, обозначенный белым цветом. В данном примере легко заметить отличия макроблочных остатков, характеризующих неизбежную внутреннюю ошибку вследствие приближённости математических преобразований, хотя визуально, кодируемый и декодированный кадр почти не отличаются.
Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Исследование и разработка методов сжатия подвижных изображений с использованием расширенных вейвлет-разложений2019 год, кандидат наук Дам Чонг Нам
Разработка и исследование высокоэффективных систем цифровой обработки динамических изображений и оценки ее качества2007 год, доктор технических наук Дворкович, Александр Викторович
Методы улучшения параметров цифровой системы видеонаблюдения при передаче цветовой информации2014 год, кандидат наук Сухов, Тимофей Михайлович
Повышение достоверности информации в телевизионном канале передачи изображений дистанционно управляемых роботов2007 год, кандидат технических наук Петухов, Андрей Сергеевич
Разработка методов и устройств компенсации пространственно-временных искажений в системах цифрового телевидения2008 год, кандидат технических наук Поляков, Дмитрий Борисович
Список литературы диссертационного исследования кандидат наук Калистратов, Дмитрий Сергеевич, 2015 год
ЛИТЕРАТУРА
1. Вернер, М. Основы кодирования / М. Вернер. - М.: Техносфера, 2004. - 288 с.
2. Ричардсон, Я. Видеокодирование. Н.264 и MPEG-4 - стандарты нового поколения / Я. Ричардсон. - М.: Техносфера, 2005. - 368 с.
3. Сэломон, Д. Сжатие данных, изображений и звука / Д. Сэломон. — М.: Техносфера, 2004. - 368 с.
4. Александров, В.В. Представление и обработка изображений/ В.В. Александров, Н.Д. Горский. - Л.: Наука, 1985. - 192 с.
5. Берлекэмп, Э. Алгебраическая теория кодирования / Э. Берлекэмп. - М.: Мир, 1971.-477 с.
6. Ватолин, Д. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. - М.: Диалог-МИФИ, 2003. - 384 с.
7. Касами, Т. Теория кодирования / Т. Касами , Н. Токура, Е. Ивадари, Я.Инагаки. -М.: МИР, 1978.-576 с.
8. Марков, A.A. Введение в теорию кодирования / A.A. Марков. - М.: Наука, 1982.-192 с.
9. Хэмминг, Р.В. Теория кодирования и теория информации / Р.В. Хэмминг. -М.: Радио и связь, 1983.-176 с.
Ю.Чисар, И. Теория информации: теоремы кодирования для дискретных систем без памяти / И. Чисар, М. Кернер. - М.: Мир, 1985. - 400 с.
П.Яншин, В.В. Анализ и обработка изображений (принципы и алгоритмы) / В.В. Яншин. - М.: Машиностроение, 1994. - 112 с.
12.Джакония, В.Е. Телевидение: учебник для высших учебных заведений / В.Е. Джакония. - М.: Горячая линия - Телеком, 2007. - 616 с.
13. Бродский, М.А. Цветные телевизоры / М.А. Бродский. - Минск: Высшая школа, 1994.-271 с.
14.Поляков, А.Ю. Цифровое объёмное телевидение / А.Ю. Поляков// Техника кино и телевидения, 2009.- №1.
15.Владимиров, B.C. Уравнения математической физики / B.C. Владимиров. -изд. 4-е. - М.: Наука. Главная редакция физико-математической литературы, 1981.-512 с.
16. Мултановский, В.В. Курс теоретической физики: Классическая механика. Основы специальной теории относительности. Релятивистская механика: учебное пособие / В.В. Мултановский. - М.: Просвещение, 1988. - 304 с.
17. Мартинсон, JI.K. Дифференциальные уравнения математической физики: учеб. для вузов / JI.K. Мартинсон; под ред. B.C. Зарубина, А.П. Крищенко. — 2-е изд.- М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 368 с.
18. Морозова, В.Д. Введение в анализ / В.Д. Морозова; под ред. В. С. Зарубина, А. П. Крищенко. - М.: Изд-во МГТУ им. Баумана, 1996. - 408 с.
19. Канатников, А.Н. Аналитическая геометрия: учеб. для вузов / А.Н. Канатников, А.П. Крищенко; под ред. B.C. Зарубина, А.П. Крищенко. - 2-е изд. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. - 388 с.
20. Канатников, А.Н. Линейная алгебра: учеб. для вузов / А.Н., Канатников, А.П. Крищенко; под ред. B.C. Зарубина, А.П. Крищенко. - 3-е изд.-М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 336 с.
21.Иванова, Е.Е. Дифференциальное исчисление функций одного переменного: учеб. для вузов / Е.Е. Иванова; под ред. B.C. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 1998. - 408 с.
22. Канатников, А.Н. Дифференциальное исчисление функций многих переменных: учеб. для вузов / А.Н. Канатников, А.П. Крищенко, В.Н. Четвериков; под ред. B.C. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. - 456 с.
23. Зарубин, B.C. Интегральное исчисление функций одного переменного: учеб. для вузов / B.C. Зарубин, Е.Е. Иванова, Г.Н. Кувыркин; под ред. B.C. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 1999. - 528 с.
24. Гаврилов, В.Р. Кратные и криволинейные интегралы. Элементы теории поля: учеб. для вузов / В.Р. Гаврилов, Е.Е. Иванова, В.Д. Морозова; под ред. B.C.
Зарубина, А.П. Кршценко. - 2-е изд. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2003.-496 с.
25. Агафонов, С.А. Дифференциальные уравнения: учеб. для вузов. / С.А. Агафонов, А.Д. Герман, Т.В. Муратова; под ред. B.C. Зарубина, А.П. Крищенко. - 3-е изд. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. - 352 с.
26. Гюнтер, Н.М. Интегрирование уравнений первого порядка в частных производных / Н.М. Гюнтер. - М.: Государственное технико-теоретическое издательство, 1934. - 359 с.
27. Кетков, Ю.Л. MATLAB 7: программирование, численные методы. / Ю.Л. Кетков, A.IO. Кетков, М.М. Шульц. - СПб.: БХВ-Петербург, 2005. - 752 с.
28. Щупак, Ю.А. Win32 АРГЭффективная разработка приложений / Ю.А. Щупак.
- СПб.: Питер, 2007. - 572 с.
29. Пахомов, Б.И. C/C++ и MS Visual С++2008/ - для начинающих / Б.И. Пахомов.
- СПб.: БХВ-Петербург, 2009. - 624 с.
30. Хортон, Х82 Visual С++2005: базовый курс.: Пер. с англ. / Хортон, Айвор. -М.: ООО «И.Д. Вильяме», 2007. - 1152 с.
31. Калистратов, Д.С. Видеокодирование. Способы компенсации движения в цифровых динамических видеоизображениях: монография / Д.С. Калистратов. -Новосибирск: Издательство ЦРНС, 2014. -96 с.
32. Заявка № 2013155777 Российская федерация, МПК7: Н03М 7/00. Способ компенсации движения в цифровых динамических видеоизображениях / Минаков Е.И., Калистратов Д.С.; заявитель ТулГУ; заявл. 16.12.2013. - 37с. (Решение о выдаче патента от 09.02.2015).
33. Заявка № 2013155875 Российская федерация, МПК7: НОЗМ 7/00. Способ компенсации движения в цифровых динамических стереовидеоизображениях / Минаков Е.И., Калистратов Д.С.; заявитель ТулГУ; заявл. 16.12.2013. - 59с. (Решение о выдаче патента от 22.01.2015).
34. Калистратов, Д.С. Видеокодек / Д.С. Калистратов, Е.И. Минаков // Свидетельство об официальной регистрации программы для ЭВМ № 2014616903, РОСПАТЕНТ, 08.09.2014.
35.Калистратов, Д.С. Влияние флуктуационных помех на качество кадрового прогноза в компенсаторах движения современных видеокаскадов / Е.И. Минаков, Д.С. Калистратов // Вестник ТулГУ. Сер. Радиотехника и радиооптика. Тула: Изд-во ТулГУ, 2012. T.XII. С.129 - 133.
36. Калистратов, Д.С. Режимы формирования кадровых прогнозов в компенсаторах движения видеообъектов / Е.И. Минаков, Д.С. Калистратов // Известия Тул ГУ. Технические науки. Вып. 11 4.2. Тула: Изд-во ТулГУ, 2012. С.188-193.
37.Калистратов, Д.С. Критерии сходства фрагментов видеоизображения и их влияние на качество компенсации движения / Е.И. Минаков, Д.С. Калистратов// Сборник научных статей Российского НТО радиотехники, электроники и связи имени A.C. Попова. Тульское областное правление РНТО РЭС им. A.C. Попова, ФЭБОУ ВПО «РОССИЙСКАЯ АКАДЕМИЯ НХ и ГС при ПРЕЗЕДЕНТЕ РФ», ФГБОУ ВПО «ТулГУ». XXX научная сессия, посвященная дню радио. - Тула: Изд-во ТулГУ, 2012. - С. 350-354.
38. Калистратов, Д.С. Влияние параметров кадровой фрагментации на показатели качества современных видеокодеков / Д.С. Калистратов // Научно-практический журнал «Приволжский научный вестник» - 2014 - С. 25-27.
39. Калистратов, Д.С. Влияние параметров поисковых алгоритмов компенсации движения на показатели качества современных видеокодеков / Д.С. Калистратов // Молодой ученый. Ежемесячный научный журнал № 5 2014 г. -Казань: Изд-во ООО «Издательство Молодой ученый», 2014. - С. 20-23.
40. Калистратов, Д.С. Метод формирования бинарной кадровой маски движения/ Е.И. Минаков, Д.С. Калистратов // Жур. «Цифровая обработка сигналов» -2013. -№ 1-С. 34-37.
41. Калистратов, Д.С. Перспективы использования многомерных функций для оценки качества работы современных видеокодеков / Д.С. Калистратов // Журнал научных публикаций аспирантов и докторантов №4 Апрель 2014 г. -Курск: Изд-во ООО «Призма», 2014. - С. 309-311.
42. Калистратов, Д.С. Метод ускоренной геометрической стабилизации изображений видеосигнала нестационарного источника аэровидеосъёмки / И.Е. Агуреев, Е.И. Минаков, Д.С. Калистратов // Известия Тул ГУ. Технические науки. Вып.11 4.2. Тула: Изд-во ТулГУ, 2014. - С. 238-244.
43. Калистратов, Д.С. Методы геометрической реконструкции пространственной стереовидеоповерхности / Е.И. Минаков, Д.С. Калистратов // Жур. «Вестник компьютерных и информационных технологий». - 2014. - № 11 - С. 25-27.
44. Калистратов, Д.С. Применение гибридных аналогово-цифровых систем для повышения эффективности телевизионных изображений / Е.И. Минаков, Д.С. Калистратов //Жур. «Электроника» - 2015. -№ 1 - С. 100-103.
45. Калистратов, Д.С. Влияние флуктуационных помех на качество кадрового прогноза в компенсаторах движения видеокодеков / Е.И. Минаков, Д.С. Калистратов // Проблемы наземной радиолокации. Труды IX Всероссийской научно - технической Интернет - конференции. Тула, 27-28 сентября 2012 г./ Под общ. ред. д.т.н., проф. Л.Н. Толкалина. - Тула: Изд-во ТулГУ, 2012. - С. 41-43.
46.Калистратов, Д.С. Методы формирования бинарной кадровой маски движения / Д.С. Калистратов // Микроэлектроника и информатика - 2013. 20-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - М.: МИЭТ, 2013. -340с. - 188 с.
47. Калистратов, Д.С. Перспективы использования многомерных функций для оценки качества работы современных видеокодеков / Д.С. Калистратов // Перспективы развития информационных технологий: сборник статей материалов ХУ1П Международной научно-практической конференции под общ. ред. С.С. Чернова. - Новосибирск: Издательство ЦРНС, 2014. - С. 29-31.
48. Калистратов, Д.С. Способы компенсации движения в цифровых динамических видеоизображениях / Д.С. Калистратов // Перспективы развития информационных технологий: сборник статей материалов XVTII Международной научно-практической конференции под общ. ред. С.С. Чернова. - Новосибирск: Издательство ЦРНС, 2014. - С. 31-36.
49. Калистратов, Д.С. Способы компенсации движения в цифровых динамических стереовидеоизображениях / Д.С. Калистратов // Актуальные проблемы технических наук - 2014: сборник статей Международной научно-практической конференции 21 апреля 2014 г. /отв. ред. А.А. Сукиасян. - Уфа: Аэтерна, 2014. - С. 34-38.
50. Калистратов, Д.С. Метод геометрической реконструкции пространственной стереовидеоповерхности / Д.С. Калистратов // Актуальные проблемы технических наук - 2014: сборник статей Международной научно-практической конференции 21 апреля 2014 г. /отв. ред. А.А. Сукиасян. - Уфа: Аэтерна, 2014. - С. 38-40.
51. Bhaskaran, V., Konstantinides К. Image and Video Compression Standard: Algorithms and Architectures. Kluwer, 1997.
52. Ghanbari, M. Video Coding: An Introduction to Standard Codecs. IEE Press, 1999.
53. Haskell, В., Puri A., Netravali A. Digital Video: An Introduction to VPEG-2. Charman & Hall, 1996.
54. Parhi, K.K., Nishitani T. (eds.). Digital Signal Processing for Multimedia Systems. Marsel Dekker, 1999.
55. Pennebaker, W.B., Mitchell J.L., Fogg C., LeGall D. MPEG Digital Video Compression Standard, Chapman & Hall, 1997.
56. Pereira., Ebrahimi T. (eds.). The MPEG-4 Book. IMSC Press, 2002.
57. Puri, A., Chen T. (eds.). Multimedia Systems, Standards and Networks. Marsel Dekker, 2000.
58. Rao, K.R., Hwang J.J. Techniques and Standards for Image, Video and Audio Coding. Prentice Hall, 1997.
59. Richardson, I.E.G. Video Codec Design. John Wiley & Sons, 2002.
60. Riley, M.J., Richardson I.E.G. Digital Video Communications. Artech House, 1997.
61. Sadka, A. Compressed Video Communications. John Wiley & Sons, 2002.
62. Walsh, A., Bourges-Sevenier M. (eds.). MPEG-4 Jump Start. Prentice-Hall, 2002.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.