Исследование и разработка видео кодека на основе многоканального вейвлет преобразования тема диссертации и автореферата по ВАК РФ 05.12.13, кандидат наук Быстров Кирилл Сергеевич
- Специальность ВАК РФ05.12.13
- Количество страниц 146
Оглавление диссертации кандидат наук Быстров Кирилл Сергеевич
Введение
1. Использование многоканального вейвлет-преобразования в задачах сжатия изображений
1.1. Дискретные ортогональные преобразования в задачах сжатия изображений
1.2. Классические двухканальные схемы вейвлет-преобразования
1.3. Многоканальное вейвлет-преобразование
1.4. Постановка задачи исследования
1.5. Оценка эффективности предложенных в исследовании методов
1.6. Выводы по главе
2. Реализация многоканального вейвлет видео кодека
2.1. Программная реализация многоканального вейвлет видео кодека
2.2. Тестирование сжатия видео с помощью многоканального вейвлет-пре-образования
2.3. Результаты
2.4. Выводы по главе
3. Внутрикадровое предсказание в пространстве вейвлет-коэффициентов
3.1. Методы внутрикадрового предсказания в яркостном и цветоразност-ном пространстве изображений
3.2. Метод внутрикадрового предсказания в пространстве коэффициентов вейвлет-разложения изображений
3.3. Практическая реализация
3.4. Результаты
3.5. Выводы по главе
4. Энтропийное кодирование коэффициентов вейвлет-разложения изображений методом асимметричных систем счисления
4.1. Энтропийное кодирование
4.2. Асимметричные системы счисления (ANS)
4.3. Реализация энтропийного ANS кодера для сжатия вейвлет-коэффици-ентов в рамках многоканального вейвлет видеокодирования
4.3.1. Разделение вейвлет-коэффициентов на знаковые экспоненты и мантиссы
4.3.2. Использование контекстов для энтропийного кодирования вейвлет-коэффициентов
4.3.3. Арифметический кодер, используемый в сравнении с предложенным методом ANS кодирования вейвлет-коэффициентов
4.4. Результаты
4.4.1. Соотношение степени сжатия данных и качества восстановленного изображения
4.4.2. Скорость кодирования
4.5. Выводы по главе
Заключение
Список литературы
Приложение А
Рекомендованный список диссертаций по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Разработка и исследование методов повышения эффективности сжатия в современных видеокодеках2018 год, кандидат наук Нгуен Ван Чыонг
Исследование и разработка методов сжатия подвижных изображений с использованием расширенных вейвлет-разложений2019 год, кандидат наук Дам Чонг Нам
Методы и устройства преобразования и квантования вейвлет-спектров при внутрикадровом сжатии цифровых телевизионных сигналов2012 год, кандидат технических наук Мочалов, Иван Сергеевич
Видеокомпрессия на основе дискретного вейвлет-преобразования и блочной компенсации движения2018 год, кандидат наук Шаронов Игорь Олегович
Разработка и исследование высокоэффективных систем цифровой обработки динамических изображений и оценки ее качества2007 год, доктор технических наук Дворкович, Александр Викторович
Введение диссертации (часть автореферата) на тему «Исследование и разработка видео кодека на основе многоканального вейвлет преобразования»
Введение
Актуальность работы. С развитием телекоммуникационных систем и мультимедийных технологий неуклонно растут объёмы передаваемых медиаданных, а вместе с ними повышаются и требования к эффективности работы систем кодирования информации, в том числе к алгоритмам сжатия видеоконтента. Как было показано в отчетах Cisco [1], прогнозирующих специфику развития телекоммуникационных сетей в период 2017-2022, доля передаваемого видеоконтента в сети интернет увеличится с 75% в 2017 году до 82% в 2022 году.
Кроме того, увеличиваются и средние объемы передаваемых видео данных в связи с увеличением разрешения изображений в современных форматах цифрового видео. По данным другого отчета Cisco на период 2018-2023 [2] к 2023 году около 66% выпускаемых телевизоров будут иметь разрешение экрана ультра высокой четкости (UHD - Ultra High Definition), против 33% на 2018 год. При этом технология телевидения ультра высокой четкости потребует скорости битового потока около 15-18 МБит/с, что примерно в 2 раза больше, чем для телевидения высокой четкости (HD - High Definition) [2]. Также необходимо учитывать, что общий объем видео данных в интернет трафике увеличивается за счет широкого использования сервисов потокового телевещания, систем облачного хранения данных, увеличения числа камер безопасности и других устройств, осуществляющих передачу видео через интернет [2].
В то же время пропускные способности каналов передачи данных растут не так быстро. В связи с этим для построения сложных информационных систем критически важно кодировать видео данные как можно компактнее, что позволяет передавать больше данных по тому же самому информационному каналу, увеличивая скорость работы таких систем.
Одним из способов понижения объемов выходного битового потока при кодировании визуальных данных является использование дискретных ортогональных преобразований [3]. Дискретные ортогональные преобразования активно используются во всех современных стандартах сжатия изображений и видео, например, в таких как H.264 [4, 5], H.265 [6, 7], JPEG [8] и многих других. Одним из дискретных ортогональных преобразований, позволяющих достигать значительных степеней сжатия, является дискретное вейвлет-преобразование, которое используется в таких стандартах сжатия, как JPEG2000 [9], видео кодеках Dirac [10] и Schrodinger [11].
тически во всех существующих исследованиях рассматривается лишь двухканальная схема, уступающая по эффективности кодирования многоканальному аналогу [12]. Таким образом, разработка видеокодирующих систем на базе многоканального вейвлет-преобразования является актуальным направлением исследований.
Степень разработанности темы. Исследование свойств вейвлет-преобразования и особенностей его использования в задачах сжатия изображений является достаточно глубоко изученной темой, однако исследование способов построения видеокодирующих систем на базе многоканального вейвлет-преобразования является открытой задачей. Исследованиям вейвлет-преобразования и смеженных проблем в задачах сжатия изображений посвящено значительное количество работ, среди которых стоит отметить российских и зарубежных ученых: I. Daubechies [13, 14, 15, 16, 17], S. G. Mallat [18, 19], Y. Meyer [20], J. Morlet [21, 22], A. Grossmann [21], A. Haar [23], N. Ahmed [3, 24], С.В. Умняшкина [25, 26], В.П. Дворко-вича [27, 28], А.В. Дворковича [27, 28, 12], В.И. Воробьёва [29], В.Г. Грибунина [29], Ю.А. Романюка [30], и др. Среди этих работ часть посвящена методам построения банков фильтров многоканального вейвлет-преобразования. Однако, на момент публикации результатов диссертации не было реализовано ни одной видеокодирующей системы на базе многоканального вейвлет-разложения изображений, а значит и не было возможности на практике оценить перспективность предложенного подхода по сравнению с использованием дискретных ортогональных преобразований.
Также необходимо отметить, что видео кодек - сложная система, состоящая из множества блоков, выполняющих разнородные операции, однако их действия должны быть согласованы, а параметры выбираться таким образом, чтобы получить максимальную эффективность для совокупной системы, поэтому разработка системы сжатия должна затрагивать сразу все аспекты. Особый интерес представляет разработка специфичных для вейвлет-коэф-фициентов операций внутрикадрового предсказания и энтропийного кодирования, так как именно они используются в дополнение к дискретным преобразованиям для понижения энтропии выходных данных.
Хотя внутрикадровое предсказание является в настоящее время распространенной техникой сжатия изображений [31, 32], применяемой к яркостной и цветоразностной компоненте изображения, которая используется в стандартах сжатия изображений H.264 [4, 5] и H.265 [6, 7], вопросы ее применения к коэффициентам вейвлет-разложения изображений почти не были исследованы. Также еще не было исследований по использованию внутрикад-рового предсказания на разных уровнях вейвлет-разложения изображений (на разном уровне преобразований в пирамиде Малла [19]), как и для результатов многоканального вейвлет-раз-
ложения изображений. Поэтому актуальным является разработка техники внутрикадрового предсказания в пространстве вейвлет-коэффициентов и исследование особенностей ее применения к разным пространственно-частотным областям вейвлет-разложения изображений.
Другой важной составляющей видеокодирующих систем является энтропийный кодер. В последние годы появился новый и пока еще слабо изученный метод энтропийного кодирования - асимметричные системы сличения (ANS), преимуществами которого являются быстрота кодирования и высокие степени сжатия данных. Автором этого метода энтропийного кодирования является польский математик Ярек Дуда [33, 34, 35]. Также ANS кодирование уже используются в ряде систем сжатия для визуальной информации: в компрессоре полигональных сеток и 3D информации Draco (Google) [36], в формате сжатия изображений PIK-compressor (Google) [37], в новом стандарте сжатия изображений JPEG XL [38] (пока в разработке). Тем не менее, данный метод до сих пор не используется непосредственно для видеокодирования, и еще не было исследований по применению ANS для энтропийного кодирования вейвлет-коэффициентов. Также, еще не было исследований по построению контекстных моделей для ANS кодирования коэффициентов пространственно-частотных областей вейвлет разложения изображения. Предполагается, что предложенные походы позволят повысить степень сжатия изображений при использовании дискретного вейвлет-преобразо-вания. Поэтому исследование способов применения ANS в качестве энтропийного кодера в системах видеокодирования, основанных на вейвлет-разложении изображений, представляется новым и актуальным.
Результаты исследования соответствуют пунктам 2 и 12 паспорта научной специальности 05.12.13 — Системы, сети и устройства телекоммуникаций:
2. Исследование процессов генерации, представления, передачи, хранения и отображения аналоговой, цифровой, видео-, аудио- и мультимедиа информации; разработка рекомендаций по совершенствованию и созданию новых соответствующих алгоритмов и процедур.
12. Разработка методов эффективного использования сетей, систем и устройств телекоммуникаций в различных отраслях народного хозяйства.
Объектом исследования является процесс сжатия цифровой визуальной информации с использованием дискретного вейвлет-преобразования.
Предметом исследования являются:
1. подход к построению систем видеокодирования на основе дискретного многоканального вейвлет-преобразования;
Цель работы и задачи исследования. Целью работы является разработка высокоэффективного с точки зрения сжатия данных видео кодека, основанного на многоканальном вейвлет-разложении изображений. Для достижения поставленной цели были определены следующие задачи:
1. разработать программную реализацию многоканального вейвлет-видеокодека;
2. разработать технику внутрикадрового предсказания в пространстве вейвлет-коэффициен-тов, а также исследовать результаты ее использования в задачах сжатия изображений;
3. разработать алгоритм энтропийного кодирования вейвлет-коэффициентов.
Методы исследования. В диссертации используются методы теории цифровой обработки сигналов, теории информации, теории видеокодирования, методы квадратичной и кубической интерполяции, методы статистического кодирования. Для разработки и отладки программного обеспечения, использовавшегося для получения результатов диссертации, использовались языки программирования C и OpenCL, среды разработки CLion и Visual Studio Code. Для расчета банков фильтров многоканального вейвлет-разложения и их характеристик использовались система компьютерной алгебры Wolfram Mathematica и пакет прикладных программ MATLAB.
Научная новизна заключается в том, что:
1. Разработана новая методика внутрикадрового предсказания в пространстве вейвлет-коэф-фициентов, основанная на режимах внутрикадрового предсказания H.264. Впервые исследованы свойства внутрикадрового предсказания для разных пространственно-частотных областей вейвлет-разложения изображения.
2. Разработаны новые контекстные модели для коэффициентов пространственно-частотных областей вейвлет-разложения изображения, используемые при энтропийном кодировании.
3. Впервые построен алгоритм энтропийного кодирования коэффициентов вейвлет-разложе-ния изображений на основе асимметричных систем счисления.
Основные положения, выносимые на защиту:
1. Разработанная программная реализация многоканального вейвлет видео кодека позволяет достичь до 31% снижения битрейта на уровне качества восстановленного изображения PSNR, равного 40 дБ, по сравнению с использованием кодека x264.
2. Разработанный новый метод внутрикадрового предсказания в пространстве вейвлет-коэф-фициентов позволил достичь до 6% уменьшения энтропии визуальных данных при качестве восстановленного сигнала в интервале PSNR от 36 до 42 дБ в полу-низкочастотных областях вейвлет-разложения изображений, а при использовании контекстов позволяет
достичь до 55% уменьшения энтропии от исходной в низкочастотных областях вейвлет-разложения изображений. 3. Разработанный метод энтропийного кодирования результатов вейвлет-разложения изображений позволяет снизить битрейт до 6%, при среднем качестве восстановленного видео в диапазоне РБКИ, от 36 до 42 дБ, по сравнению с использованием арифметического кодера.
Теоретическая и практическая ценность. Использование теоретических результатов, полученных в диссертации, позволит построить видеокодирующие системы с большими степенями сжатия визуальных данных.
Результаты работы внедрены и используются на практике, что подтверждено соответствующими актами. В частности, теоретические и практические результаты диссертационной работы, а именно, программная реализация многоканального вейвлет видео кодека, была использована в рамках выполнения НИР по проекту ПНИЭР «Разработка программных и технических средств для эфирных видеоинформационных систем вещания и связи массового и специального применения с использованием ограниченного частотного ресурса» рамках реализации федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно- технологического комплекса России на 2014 - 2020 годы», соглашение о предоставлении субсидии № 14.581.21.0015 от 16 октября 2015 г. между Министерством науки и высшего образования Российской Федерации и МФТИ.
Достоверность результатов исследований подтверждается численным моделированием в среде Ма11аЬ и серией экспериментов с помощью программных модулей, написанных в рамках данного исследования, и сравнения их результатов с опорными методами. Во всех экспериментах, кроме связанных с техникой внутрикадрового предсказания в пространстве вейвлет-коэффициентов, в качестве объективной оценки качества сжатия изображений используется метрика "битрейт - РБКИ", характеризующая соотношение степени сжатия данных и качества восстановленных изображений. РБКИ, широко и активно используется в задачах обработки изображений как объективная мера искажений сигнала, в то время как битрейт характеризует объем данных в битах, необходимый для передачи сжатых изображений с заданной частотой кадров. В экспериментах, связанных с разработкой техники внут-рикадрового предсказания в пространстве вейвлет-коэффициентов, в качестве объективной оценки качества сжатия используется метрика "энтропия - РБКИ", где энтропия характеризует объем данных в битах, минимально необходимый для восстановления без потерь исходной информации.
1. 19-ая Международная Конференция «Цифровая обработка сигналов и её применение» (DSPA-2017): Москва, 29-31 марта 2017 г. - ИПУ им. В.А. Трапезникова РАН
2. 20-ая Международная научная конференции «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN 2017), Москва, 25-29 сентября 2017 г.
3. IV Международная конференция «Инжиниринг и Телекоммуникации- En&T 2017»: Москва, 29-30 ноября 2017 г.
4. 61-ая Всероссийской научной конференции МФТИ: Долгопрудный, 19-25 ноября 2018 года.
5. 22-ая Международная научная конференции «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN 2019), Москва, 23-27 сентября 2019 г.
Публикации. Основные результаты диссертации опубликованы в 4 рецензируемых научных изданиях, индексируемых в Scopus [39, 40, 41, 42], а также в 7 трудах конференций [43, 44, 45, 46, 47, 48, 49]. Все работы были опубликованы в соавторстве. Личный вклад соискателя в работах с соавторами заключается в следующем: в работах [43, 44, 45, 39, 40, 47] - разработка многоканального вейвлет видео кодека и методов его оптимизации, исследование свойств многоканального вейвлет-разложения изображений; в работах [49, 42] — разработка метода энтропийного кодирования коэффициентов вейвлет-разложения изображений с помощью асимметричных систем счисления, его программная реализация и проведение экспериментов на видео последовательностях; в работах [41, 46, 48] — разработка метода внутрикадрового предсказания в пространстве вейвлет-коэффициентов, его программная реализация и проведение экспериментов на статических изображениях.
Объем и структура диссертации. Диссертация состоит из введения, 4 глав, заключения, библиографии и приложения с актами использования результатов диссертационной работы. Общий объем диссертации 146 страниц, включая 105 рисунков и 13 таблиц. Библиография включает 122 наименования.
Во введении обоснована актуальность темы, ее теоретическая и практическая значимость, сформулированы цель и задачи исследования.
Первая глава посвящена обзору классических подходов к сжатию визуальной информации, большинство из которых используют дискретные ортогональные преобразования. Были подробно рассмотрены ряд дискретных ортогональных преобразований, использующихся в задачах сжатия изображений, проанализированы их достоинства и недостатки.
Отдельно было рассмотрено дискретное вейвлет-преобразование, проанализированы его достоинства и недостатки, обосновано его применение как альтернативы классическим дискретным ортогональным преобразованиям.
Были рассмотрены классические двухканальные схемы вейвлет-преобразования и особенности их применения в обработке изображений. Было предложено использование многоканального вейвлет-преобразования как альтернативы двухканальным схемам, показана возможность достижения лучших степеней сжатия изображений за счет лучших декоррели-рующих свойств при правильном подборе банка фильтров дискретного вейвлет-преобразования.
На основе проведенного в данной главе анализа были сформулированы методы оценки эффективности решений, предложенных в данной работе.
Во второй главе рассмотрена разработанная в рамках данного исследования реализация многоканального вейвлет видео кодека. Эффективность видеокодирования разработанного вейвлет видео кодека была проверена на тестовом наборе видеопоследовательностей и сравнена с результатами сжатия видео кодеков x264 и x265 для тех же видео. Были сделаны выводы о перспективности использования разработанной реализации многоканального вей-влет видео кодека в видеокодировании и предложены способы повышения степеней сжатия предложенной видеокодирующей системы, которым посвящены следующие главы диссертации.
Третья глава посвящена разработке метода внутрикадрового предсказания в пространстве вейвлет-коэффициентов. В рамках этой главы рассматривается метод внутрикадрового предсказания, используемый в стандартах сжатия H.264/H.265, рассматриваются методы адаптации этой техники для работы с вейвлет-коэффициентами. На основании предложенного подхода был разработан программный модуль внутрикадрового предсказания в пространстве вейвлет-коэффициентов, чья эффективность сжатия данных была проверена на наборе тестовых изображений. На основании полученных результатов были сделаны выводы о перспективности предложенного метода внутрикадрового предсказания в пространстве вейвлет-коэффициентов.
В четвертой главе рассмотрен разработанный в рамках данного исследования алгоритм энтропийного кодирования вейвлет-коэффициентов с помощью асимметричных систем счисления (ANS). В главе рассматривается использование энтропийного кодирования в задачах сжатия изображений, обосновывается выбор асимметричных систем счисления в качестве энтропийного кодера для предложенной реализации многоканального вейвлет видео кодека. Для повышения эффективности ANS кодирования вейвлет-коэффициентов были
предложены две модификации алгоритма кодирования - разделение вейвлет-коэффициентов на знаковые экспоненты и мантиссы, а также были предложены новые контекстные модели для коэффициентов вейвлет-разложения изображений. Эффективность разработанного алгоритма была проверена на тестовом наборе видеопоследовательностей и сравнена с результатами сжатия данных арифметического кодера для тех же видео. Были сделаны выводы о перспективности использования предложенного алгоритма энтропийного кодирования для сжатия вейвлет-коэффициентов.
В заключении подводятся итоги работы, проделанной в рамках диссертации.
1. Использование многоканального вейвлет-преобразования в задачах сжатия изображений
1.1. Дискретные ортогональные преобразования в задачах сжатия изображений
Современные технологии компрессии изображений и видео включают как методы сжатия информации без потерь, такие как энтропийное кодирование, межкадровое и внутри-кадровое предсказание, так и методы сжатия информации с потерями, например совместное использование дискретных ортогональных преобразований и квантования. Первые методы позволяют однозначно восстановить сжатые данные, но они уступают по степени сжатия вторым, которые, тем не менее, вносят неустранимые при восстановлении потери исходной информации [50].
Сжатие визуальной информации с потерями основано на несовершенстве человеческого зрения — им в среднем лучше воспринимаются изменения в низких частотах яркостных и цветоразностных составляющих изображения, чем в высоких [51]. При этом большая часть энергии изображения обычно концентрируется в низких частотах, что позволяет более компактно представлять сигнал. Эти особенности восприятия визуальной информации используются для уменьшения выходного потока бит при условно незначительном перцептуальном ухудшении качества восстановленного изображения, что достигается за счет более грубого квантования высокочастотной информации по сравнению с низкочастотной [52]. Для этого необходимо перевести данные из яркостного и цветоразностного пространственного представления изображений в частотное. Именно с этой целью используются дискретные ортогональные преобразования в задачах сжатия изображений [3].
Как правило, используются блочные версии дискретных ортогональных преобразований [53]: изображение или его составляющие разделяются на пространственные блоки, над каждым из которых по отдельности совершается выбранное преобразование. Предпочтение такого подхода обусловлено меньшими вычислительными затратами и требованиями на память для преобразования отдельного блока, что особенно актуально в условиях ограниченных ресурсов памяти и вычислительной мощности кодирующего/декодирующего устройства. Кроме того, малый размер блока преобразования упрощает задачу проектирования интегральных микросхем, специализированных для этих целей, а также позволяет уменьшить их размер и стоимость производства.
блочных преобразований, чьи базисные функции являются масштабированными под определенный размер блока аппроксимациями базисных функций ДКП, используются во многих стандартах сжатия видео, например в H.264 [4, 5] и H.265 [6, 7], а также в таких стандартах сжатия статических изображений как JPEG [8]. К преимуществам данного типа преобразования можно отнести следующие свойства:
- возможность целочисленных аппроксимаций [54, 55], ускоряющих процесс вычисления результатов преобразования;
- сепарабельность, которая позволяет представить двумерное преобразование блока изображения как 2 последовательных одномерных; хотя в большинстве случаев двумерные преобразования для блока данных работают быстрее (глава 7.1.7 в [27]), тем не менее возможно построить быстрые схемы на одномерных преобразованиях [56, 57, 58];
- ортогональность и хорошие декоррелирующие свойства, близкие по эффективности к преобразованию Кархунена-Лоэва [3, 27];
- хорошая энергетическая компактность для высоко коррелированных внутри блока данных [50], что часто характерно для изображений;
- симметричность преобразования, которая также предоставляет возможности для оптимизаций вычислений [59].
Все вышеперечисленные свойства привели к тому, что на сегодняшний день есть много программных и аппаратных реализаций "быстрого" ДКП.
С другой стороны, такое использование ДКП ведет к артефактам в виде блочности восстановленного изображения: наблюдаются резкие переходы на границах блоков (см. рис. 1). Так как преобразованию подвергаются отдельные блоки изображения, то не учитываются корреляции между пикселями из соседних блоков, что при последующем квантовании коэффициентов ДКП ведет к искажению этой корреляции при восстановлении изображения. Данный тип артефактов особенно сильно проявляется при низких битовых скоростях кодера из-за ограничений пропускной способности информационного канала, что заставляет квантовать результаты преобразования более грубо; это, в свою очередь, ведет к еще большему искажению корреляции между пикселями из соседних блоков, что приводит к более резким переходам между блоками восстановленного изображения. С данным эффектом можно частично бороться с помощью деблокинг-фильтров [60, 5] или блочных дискретных преобразований с перекрытием (lapped/overlapped transforms в англоязычной литературе) [61, 62],
но это требует дополнительных вычислительных затрат, что ухудшает производительность кодирующего и декодирующего устройств. Также стоит отметить другой характерный тип помех, связанный с квантованием результатов ДКП — москитный шум [63]: это проявление неровностей и "дребезга" на резких границах объектов при сильном сжатии изображения.
(а) Оригинальное изображение (б) Изображение после сжатия JPEG c ДКП
Рисунок 1. Пример блокинг-эффекта, наблюдаемый при высокой степени сжатия изображения
Другим ограничением блочной версии ДКП является фиксированный порядок обработки блоков изображения при гибридном кодировании [5, 7]: к примеру, когда вместе с ДКП используются внутрикадровое и/или межкадровое предсказание, то для использования одних блоков в качестве опорных для предсказания других первые необходимо декодировать перед кодированием вторых, что ограничивает возможности по распараллеливанию процессов кодирования и декодирования изображений. Эти ограничения производительности отчасти решаются разбиением изображения на независимые области, каждую из которых можно обрабатывать отдельно и параллельно друг другу: в H.264 это слайсы и техника Arbitrary Slice Ordering [5]; в H.265 кроме слайсов используются тайлы и техника Wavefront Parallel Processing [7]. Тем не менее, использование таких разбиений и техник ведет к ухудшению качества восстановленного сигнала.
Как нетрудно заметить, все приведенные выше недостатки связаны с блочной версией преобразования. В связи с этим возникает логичная, на первый взгляд, идея — расширить ДКП на все изображение. Тем не менее, этот шаг, хотя и позволит устранить блоч-ность, в большинстве случаев приведет к ухудшению сжатия изображения из-за плохого пространственного разрешения: в обработке сигналов существует соотношение неопределенности, которое не позволяет одновременно обеспечить хорошее разрешение по времени и по частоте при применении оконных преобразований (см. рис. 2), в частности, преобразования Фурье [30, 64]. В случае изображений обработка осуществляется не во временной, а в пространственной области, а в качестве размера окна выступает размер блока преобразования.
С одной стороны, так как информация распределена по частотам неравномерно, то хорошее частотное разрешение играет большую роль. С другой стороны, так как изображения имеют локальные пространственные особенности (резкие границы, области плавного перехода и т.д.), то сильное ухудшение пространственного разрешения, которое неизбежно возникает при большом размере блока преобразования, нежелательно. Таким образом, выбор размера окна преобразования — всегда компромисс между качеством пространственного и частотного разрешений, и поэтому в задачах сжатия изображений чаще применяется блочный подход для всех методов, основанных на преобразовании Фурье и ему подобных.
Похожие диссертационные работы по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Разработка методов и устройств компенсации пространственно-временных искажений в системах цифрового телевидения2008 год, кандидат технических наук Поляков, Дмитрий Борисович
Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных2013 год, кандидат технических наук Рубина, Ирина Семеновна
Разработка методов и устройств сжатия с раздельным преобразованием составляющих спектра сигнала телевизионного изображения2013 год, кандидат технических наук Седов, Михаил Олегович
Инструментальные средства сжатия полутоновых изображений на основе адаптивного и многоступенчатого решетчатого векторного квантования2009 год, кандидат технических наук Петров, Александр Васильевич
Разработка и исследование алгоритмов устранения визуальной избыточности на основе кодирующих преобразований2021 год, кандидат наук Доан Бан Тиен
Список литературы диссертационного исследования кандидат наук Быстров Кирилл Сергеевич, 2020 год
Список литературы
Cisco VNI Complete Forecast Highlights 2022. — https://www.cisco.com/c/dam/m/ en_us/solutions/service-provider/vni-forecast-highlights/pdf/Global_2022_ Forecast_Highlights.pdf. — Accessed: 2020-10-03.
Cisco Annual Internet Report (2018-2023) White Paper. — https://www.cisco.com/ c/en/us/solutions/collateral/executive-perspectives/annual-internet-report/ white-paper-c11-741490.html. — Accessed: 2020-10-03.
Rao K., Ahmed N. Orthogonal transforms for digital signal processing // ICASSP '76. IEEE International Conference on Acoustics, Speech, and Signal Processing. — Vol. 1. — 1976. — Pp. 136-140.
ITU-T Recommendation H.264 — Advanced video coding for generic audiovisual services. — https://www.itu.int/rec/T-REC-H.264. — 06/2019. — Последний доступ: 14-09-2020. Overview of the H.264 / AVC Video Coding Standard / Thomas Wiegand, Gary J. Sullivan, Gisle Bjontegaard, Ajay Luthra // IEEE Transactions on Circuits and System,s for Video Technology. — 2003. — JULY.
ITU-T Recommendation H.265 — High efficiency video coding. — https://www.itu.int/ rec/T-REC-H.265. — 11/2019. — Последний доступ: 14-09-2020.
Overview of the High Efficiency Video Coding (HEVC) Standard / Gary J. Sullivan, Jens-Rainer Ohm, Woo-Jin Han, Thomas Wiegand // IEEE Transactions on Circuits and Sys-tem„s for Video Technology. — 2012. — DEC.
Wallace G. K. The JPEG still picture compression standard // IEEE Transactions on Consumer Electronics. — 1992. — Vol. 38, no. 1. — Pp. xviii-xxxiv.
ITU-T Recommmendation T.801. — Information Technology — JPEG 2000 Image Coding System: Extensions. — 2004.
Dirac Specification, Version 2.2.3. — BBC. — 23 сентября 2008.
Schrodinger video codec FAQ. — http://schrodinger.sourceforge.net/schrodinger_ faq.php. — Accessed: 2020-05-14.
Gryzov Gennady Yu., Dvorkovich Alexander V. Three-channel wavelet transform for video compression applications // 6 th Mediterranean Conference on Embedded Computing. — 2017. Daubechies I. Ten Lectures on Wavelets. — Philadelphia: SIAM, 1992.
Daubechies I. 3.1 Discretizing the wavelet transform // Ten Lectures on Wavelets. — Philadelphia: SIAM, 1992. — Pp. 53-56.
15. Daubechies Ingrid. Orthonormal bases of compactly supported wavelets // Communications on Pure and Applied Mathematics. — 1988. — Vol. 41, no. 7. — Pp. 909-996.
16. Cohen A, Daubechies Ingrid, Feauveau J.-C. Biorthogonal bases of compactly supported wavelets // Communications on Pure and Applied Mathematics. — 1992. — Vol. 45, no. 5.
— Pp. 485-560.
17. Image coding using wavelet transform / M. Antonini, M. Barlaud, P. Mathieu, I. Daubechies // IEEE Transactions on Image Processing. — 1992. — Vol. 1, no. 2. — Pp. 205-220.
18. Mallat Stphane. A Wavelet Tour of Signal Processing, Third Edition: The Sparse Way. — 3rd edition. — USA: Academic Press, Inc., 2008.
19. Mallat S. G. A theory for multiresolution signal decomposition: the wavelet representation // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 1989. — Vol. 11, no. 7.
— Pp. 674-693.
20. Meyer Yves. Principe d'incertitude, bases hilbertiennes et algebres d'operateurs // Seminaire Bourbaki : volume 1985/86, exposes 651-668. — 1987. — Asterisque no. 145-146. — Pp. 209-223. — Talk no. 662. URL: http://www.numdam.org/item/SB_1985-1986__28_ _209_0.
21. Grossmann Alexandre, Morlet J. Decomposition of Hardy Functions into Square Integrable Wavelets of Constant Shape // SIAM Journal on Mathematical Analysis. — 1984. — 07. — Vol. 15. — Pp. 723-736.
22. Wave propagation and sampling theory-Part II: Sampling theory and complex waves / J. Morlet, G. Arens, Eliane Fourgeau, D. Giard // Geophysics. — 1982. — 02. — Vol. 47. — Pp. 222-236.
23. Haar Alfred. Zur Theorie der orthogonalen Funktionensysteme // Mathematische Annalen.
— 1910. — Vol. 69, no. 3. — Pp. 331-371.
24. Ahmed N., Natarajan T., Rao K. R. Discrete Cosine Transform // IEEE Transactions on Computers. — 1974. — Vol. C-23, no. 1. — Pp. 90-93.
25. В. Умняшкин С. В. и Курина В. Алгоритм сжатия изображений на основе дискретного псевдокосинусного преобразования // Цифровая обработка сигналов. — 2009. — no. 3.
— Pp. 2-7.
26. Умняшкин С.В. Математические основы цифровой обработки и кодирования сигналов: Учебное пособие. — М.: МИЭТ, 2004. — 176 pp.
27. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы (теория и практика). — М.: Техносфера, 2012. — 1008 pp.
28. Дворкович В.П., Дворкович А.В. Оконные функции для гармонического анализа сигнала. — М.: Техносфера, 2016. — 208 pp.
29. Воробьёв В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. — СПб.: Военный университет связи, 1999. — 102 pp.
30. Ю.А. Романюк. Основы цифровой обработки сигналов. В 3-ч ч. Ч.1. Свойства и преобразования дискретных сигналов: Учебное пособие - 2-ое изд., перераб. — М.: МФТИ, 2007. — Vol. 1. — 332 pp.
31. Spatial prediction based intra-coding [video coding] / Zhang Nan, Yin Baocai, Kong Dehui, Yue Wenying // 2004 IEEE International Conference on Multimedia and Expo (ICME) (IEEE Cat. No.04TH8763). — Vol. 1. — 2004. — Pp. 97-100 Vol.1.
32. Intra Coding of the HEVC Standard / J. Lainema, F. Bossen, W. Han et al. // IEEE Transactions on Circuits and Systems for Video Technology. — 2012. — Vol. 22, no. 12. — Pp. 1792-1801.
33. Duda Jarek. Asymmetric numeral systems // CoRR. — 2009. — Vol. abs/0902.0271. — URL: http://arxiv.org/abs/0902.0271.
34. Duda Jarek. Asymmetric numeral systems: entropy coding combining speed of Huffman coding with compression rate of arithmetic coding. — 2014.
35. The use of asymmetric numeral systems as an accurate replacement for Huffman coding / J. Duda, K. Tahboub, N. J. Gadgil, E. J. Delp // 2015 Picture Coding Symposium (PCS). — 2015. — Pp. 65-69.
36. Google Draco 3D compression library. — https://github.com/google/draco. — Accessed: 2020-10-03.
37. Google PIK image compressor. — https://github.com/google/pik. — Accessed: 2020-10-03.
38. Rhatushnyak Alexander, Wassenberg Jan, Sneyers Jon et al. Committee Draft of JPEG XL Image Coding System. — 2019.
39. Usage of Video Codec Based on Multichannel Wavelet Decomposition in Video Streaming Telecommunication Systems / Kirill Bystrov, Alexander Dvorkovich, Viktor Dvorkovich, Gennady Gryzov // Distributed Computer and Communication Networks / Ed. by Vladimir M. Vishnevskiy, Konstantin E. Samouylov, Dmitry V. Kozyrev. — Cham: Springer International Publishing, 2017. — Pp. 108-119. — URL: https://doi.org/10.1007/ 978-3-319-66836-9_10.
40. Wavelet-Based Video Coding: Modem Implementations and Prospects of Coding Efficiency Increase / K. S. Bystrov, G. Y. Gryzov, A. V. Dvorkovich, V. P. Dvorkovich // 2017
IVth International Conference on Engineering and Telecommunication (EnT). — 2017. — Pp. 38-41.
41. The Use of Intra Prediction Method in Wavelet-Based Video Coding Systems / Gleb Verba, Kirill Bystrov, Viktor Dvorkovich, Gennady Gryzov // Distributed Computer and Communication Networks / Ed. by Vladimir M. Vishnevskiy, Konstantin E. Samouylov, Dmitry V. Kozyrev. — Cham: Springer International Publishing, 2019. — Pp. 77-88.
42. Konstantinov Fedor, Gryzov Gennady, Bystrov Kirill. The Use of Asymmetric Numeral Systems Entropy Encoding in Video Compression // Distributed Computer and Communication Networks / Ed. by Vladimir M. Vishnevskiy, Konstantin E. Samouylov, Dmitry V. Kozyrev. — Cham: Springer International Publishing, 2019. — Pp. 125-139.
43. Быстров К.С., Грызов Г.Ю. Реализация многоканального вейвлет видеокодека в реальном времени // DSPA: ВОПРОСЫ ПРИМЕНЕНИЯ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ. Издательство: Российское научно-техническое общество радиотехники, электроники и связи им. А.С. Попова (Москва). 2017. Стр. 71-73.
44. К.С. Быстров, Г.Ю. Грызов, А.В. Дворкович, В.П. Дворкович. Использование видеокодека на основе многоканального вейвлет-разложения в телекоммуникационных системах потокового телевещания // Материалы 20-й Международной научной конференции «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN 2017), Москва, 25-29 сентября 2017 г. Стр. 68-75.
45. Быстров К.С., Грызов Г.Ю., Дворкович А.В., Дворкович В.П. Вейвлетное видеокодирование: современные реализации и перспективы повышения эффективности кодирования //IV Междун. конф. «Инжиниринг & Телекоммуникации- En&T 2017»: Тезисы докладов. - Москва, 29-30 ноября 2017 г. - МФТИ, 2017. - С. 13-15.
46. Г.А. Верба, К.С. Быстров. Поиск оптимальных параметров вейвлет-компрессии изображений // Труды 61-й Всероссийской научной конференции МФТИ. 19-25 ноября 2018 года. Радиотехника и компьютерные технологии. — М.: МФТИ, 2018. Стр. 115-116.
47. В.А. Фургайло, К.С. Быстров. Реализация видеокодирования на базе многоканального вейвлет разложения изображений с использованием параллелизма вычислений в гетерогенных системах // Труды 61-й Всероссийской научной конференции МФТИ. 19-25 ноября 2018 года. Радиотехника и компьютерные технологии. — М.: МФТИ, 2018. Стр.124-125.
48. Г.А. Верба, К.С. Быстров, В.П. Дворкович, Г.Ю. Грызов. Использование метода внутрикадрового предсказания в системах видеокодирования, основанных на
вейвлет-разложении изображений // Материалы 22-й Международной научной конференции «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN 2019), Москва, 23-27 сентября 2019 г. Издательство: Российский университет дружбы народов (РУДН) (Москва). Стр.164-171.
49. Ф.Г. Константинов, Г.Ю. Грызов, К.С. Быстров. Использование ANS метода сжатия информации в вейвлет-видеокодировании // Материалы 22-й Международной научной конференции «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN 2019), Москва, 23-27 сентября 2019 г. Издательство: Российский университет дружбы народов (РУДН) (Москва). Стр.172-179.
50. Hussain A.J., Al-Fayadh Ali, Radi Naeem. Image compression techniques: A survey in lossless and lossy algorithms // Neurocomputing. — 2018. — Vol. 300. — Pp. 44 - 69. — URL: http://www.sciencedirect.com/science/article/pii/S0925231218302935.
51. Netravali A. N., Prasada B. Adaptive quantization of picture signals using spatial masking // Proceedings of the IEEE. — 1977. — April. — Vol. 65, no. 4. — Pp. 536-548.
52. Data Compression Based on Coding Methods With a Controlled Level of Quality Loss / O. Yudin, Y. Boiko, R. Ziubina et al. // 2019 IEEE International Conference on Advanced Trends in Information Theory (ATIT). — 2019. — Dec. — Pp. 22-26.
53. Aach Til. Fourier, Block and Lapped Transforms // Advances in Imaging and Electron Physics / Ed. by P. W. Hawkes. — Vol. 128. — San Diego: Academic Press, 2003. — Pp. 1-52.
54. Britanak Vladimir; Yip Patrick C.; Rao K. R. Discrete Cosine and Sine Transforms: General Properties, Fast Algorithms and Integer Approximations. — Elsevier, 2010. — 141-304 pp.
55. Park W., Lee B, Kim M. Fast Computation of Integer DCT-V, DCT-VIII, and DST-VII for Video Coding // IEEE Transactions on Image Processing. — 2019. — Vol. 28, no. 12. — Pp. 5839-5851.
56. Akansu Ali N., Haddad Richard A. Chapter 2 - Orthogonal Transforms // Multiresolution Signal Decomposition (Second Edition) / Ed. by Ali N. Akansu, Richard A. Haddad. — San Diego: Academic Press, 2001. — Pp. 11 - 111. — URL: http://www.sciencedirect.com/ science/article/pii/B9780120471416500021.
57. Cho N. I., Lee S. U. A fast 4*4 DCT algorithm for the recursive 2-D DCT // IEEE Transactions on Signal Processing. — 1992. — Vol. 40, no. 9. — Pp. 2166-2173.
58. Changhoon Yim. An efficient method for DCT-domain separable symmetric 2-D linear filtering // IEEE Transactions on Circuits and Systems for Video Technology. — 2004. — Vol. 14, no. 4. — Pp. 517-521.
59. Martucci S. A. Symmetric convolution and the discrete sine and cosine transforms // IEEE Transactions on Signal Processing. — 1994. — Vol. 42, no. 5. — Pp. 1038-1051.
60. Adaptive deblocking filter / P. List, A. Joch, J. Lainema et al. // IEEE Transactions on Circuits and Systems for Video Technology. — 2003. — Vol. 13, no. 7. — Pp. 614-619.
61. Malvar H. S., Staelin D. H. The LOT: transform coding without blocking effects // IEEE Transactions on Acoustics, Speech, and Signal Processing. — 1989. — Vol. 37, no. 4. — Pp. 553-559.
62. Directional Lapped Transforms for Image Coding / J. Xu, F. Wu, J. Liang, W. Zhang // IEEE Transactions on Image Processing. — 2010. — Vol. 19, no. 1. — Pp. 85-97.
63. Fenimore Charles, Libert John, Roitman Peter. Mosquito noise in MPEG-compressed video: test patterns and metrics // Proceedings of SPIE - The International Society for Optical Engineering. — 2002. — 04.
64. Cohen Leon. Time-Frequency Analysis: Theory and Applications. — USA: Prentice-Hall, Inc., 1995.
65. У. Прэтт. Цифровая обработка изображений. — М.: МИР, 1982. — Vol. 1-2. — 473 pp.
66. Anderson G., Huang T. Piecewise Fourier Transformation for Picture Bandwidth Compression // IEEE Transactions on Communication Technology. — 1971. — Vol. 19, no. 2. — Pp. 133-140.
67. Jain A. K. A fast Karhunen-Loeve transform for finite discrete images // Proc. Nat. Electron. Conf. — Chicago, IL: 1974. — 10.
68. Jorgensen Palle, Song Myung-Sin. Entropy Encoding, Hilbert Space and Karhunen-Loeve Transforms // Journal of Mathematical Physics. — 2007. — 10. — Vol. 48. — Pp. 103503-103503.
69. Beer Tom. Walsh transforms // American Journal of Physics. — 1981. — Vol. 49, no. 5. — Pp. 466-472. — URL: https://doi.org/10.1119/1.12714.
70. I. K. Kim K. McCann K. Sugimoto B. Bross W. J. Han, Sullivan G. "High efficiency video coding (HEVC) test model 12 (HM12) encoder description," JCTVC 14th meeting // JCTVC-N1002. — 08/2013.
71. Discrete Wavelet Transform on Consumer-Level Graphics Hardware / T. Wong, C. Leung, P. Heng, J. Wang // IEEE Transactions on Multimedia. — 2007. — Vol. 9, no. 3. — Pp. 668-673.
72. В.А. Фургайло К.С. Быстров. Реализация видеокодирования на базе многоканального вейвлет разложения изображений с использованием параллелизма вычислений в
гетерогенных системах // Труды 61-й Всероссийской научной конференции МФТИ. — 2018. — Ноябрь. — Pp. 124-125.
73. A Parallel Implementation of the 2D Wavelet Transform Using CUDA / J. Franco, G. Bernabe, J. Fernandez, M. E. Acacio // 2009 17th Euromicro International Conference on Parallel, Distributed and Network-based Processing. — 2009. — Pp. 111-118.
74. Parallel Implementation of the 2D Discrete Wavelet Transform on Graphics Processing Units: Filter Bank versus Lifting / C. Tenllado, J. Setoain, M. Prieto et al. // IEEE Transactions on Parallel and Distributed Systems. — 2008. — Vol. 19, no. 3. — Pp. 299-310.
75. Sovic A., Sersic D. Signal Decomposition Methods for Reducing Drawbacks of the DWT // Engineering review. — 2012. — Vol. 32. — Pp. 70-77.
76. Exploring the Stationary Wavelet Transform detail coefficients for detection and identification of the S1 and S2 heart sounds / Nuno Marques, Rute Almeida, Ana Paula Rocha, Miguel Coimbra. — Vol. 40. — 2013. — 01. — Pp. 891-894.
77. YANG JIANGUO, PARK S.-T. AN ANTI-ALIASING ALGORITHM FOR DISCRETE WAVELET TRANSFORM // Mechanical Systems and Signal Processing. — 2003. — Vol. 17, no. 5. — Pp. 945 - 954. — URL: http://www.sciencedirect.com/science/article/pii/ S0888327002915244.
78. Frequency-domain analysis of discrete wavelet transform coefficients and their adaptive shrinkage for anti-aliasing / E. Chae, E. Lee, W. Kang et al. // 2013 IEEE International Conference on Image Processing. — 2013. — Pp. 1071-1074.
79. Grace Sheefa Ruby, Sheela Mary Immaculate. A Study On Asphyxiating the Drawbacks of Wavelet Transform by Using Curvelet Transform. — 2015.
80. Demanet Laurent, Ying Lexing. Curvelets and wave atoms for mirror-extended images - art. no. 67010J // Proceedings of SPIE - The International Society for Optical Engineering. — 2007. — 10.
81. Do M. N., Vetterli M. The contourlet transform: an efficient directional multiresolution image representation // IEEE Transactions on Image Processing. — 2005. — Vol. 14, no. 12. — Pp. 2091-2106.
82. Ю.А. Романюк. Функции Хаара // Основы цифровой обработки сигналов. В 3-ч ч. Ч.1. Свойства и преобразования дискретных сигналов: Учебное пособие - 2-ое изд., перераб. — МФТИ. — Pp. 33-34.
83. Lemarié Pierre Gilles Meyer Yves. Ondelettes et bases hilbertiennes. // Revista Matemática Iberoamericana. — 1986. — Vol. 2, no. 1-2. — Pp. 1-18.
84. Sheng Yunlong. 10. Wavelet Transform // The Transforms and Applications Handbook: Second Edition. — 2000.
85. A REALLY FRIENDLY GUIDE TO WAVELETS. — http://www.polyvalens.com/blog/ wavelets/theory/. — Последний доступ: 27-07-2020.
86. Gall D. Le, Tabatabai A. Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques // ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing. — Los Alamitos, CA, USA: IEEE Computer Society, 1988. — apr. — Pp. 761,762,763,764. — URL: https://doi.ieeecomputersociety.org/ 10.1109/ICASSP.1988.196696.
87. Iwahashi Masahiro, Kiya Hitoshi. Non Separable Two Dimensional Discrete Wavelet Transform for Image Signals // Discrete Wavelet Transforms / Ed. by Awad Kh. Al Asmari. — Rijeka: IntechOpen, 2013. — URL: https://doi.org/10.5772/51199.
88. Lebrun J., Vetterli M. High-order balanced multiwavelets: theory, factorization, and design // IEEE Transactions on Signal Processing. — 2001. — Vol. 49, no. 9. — Pp. 1918-1930.
89. Vetterli M., Strang G. Time-varying filter banks and multiwavelets // Proceedings of IEEE 6th Digital Signal Processing Workshop. — 1994. — Pp. 223-226.
90. Theory of regular M-band wavelet bases / P. Steffen, P. N. Heller, R. A. Gopinath, C. S. Bur-rus // IEEE Transactions on Signal Processing. — 1993. — Vol. 41, no. 12. — Pp. 3497-3511.
91. Strang G., Strela V. Short wavelets and matrix dilation equations // IEEE Transactions on Signal Processing. — 1995. — Vol. 43, no. 1. — Pp. 108-115.
92. ISO/IEC 15444-3:2007. — Information technology — JPEG 2000 image coding system: Motion JPEG 2000 — Part 3:. — 2007. — URL: https://www.iso.org/standard/41570.html.
93. Constant bitrate. — https://en.wikipedia.org/wiki/Constant_bitrate. — Последний доступ: 11-09-2020.
94. Variable bitrate. — https://en.wikipedia.org/wiki/Variable_bitrate. — Последний доступ: 11-09-2020.
95. Average bitrate. — https://en.wikipedia.org/wiki/Average_bitrate. — Последний доступ: 11-09-2020.
96. x264 video codec. — https://www.videolan.org/developers/x264.html. — Последний доступ: 11-09-2020.
98. HEVC Video Codecs Comparison (Tenth MSU Video Codecs Comparison). — http://compression.ru/video/codec_comparison/hevc_2015/. — Последний доступ: 11-09-2020.
99. Test video sequences 1. — ftp://ftp.tnt.uni-hannover.de/pub/svc/testsequences/. — Accessed: 2017-08-15.
100. Test video sequences 2. — http://media.xiph.org/video/derf/. — Accessed: 2020-05-14.
101. AV1: next generation video - The Constrained Directional Enhancement Filter. — https://hacks.mozilla.org/2018/06/ av1-next-generation-video-the-constrained-directional-enhancement-filter/. — Accessed: 2020-10-03.
102. Mai Z., Nasiopoulos P., Ward R. A wavelet-based intra-prediction lossless image compression scheme // 2009 Digest of Technical Papers International Conference on Consumer Electronics. — 2009. — Pp. 1-2.
103. Hybrid wavelet - DCT intra prediction for H.264/AVC interactive encoder / T. Elarabi, A. Sammoud, A. Abdelgawad et al. // 2014 IEEE China Summit International Conference on Signal and Information Processing (ChinaSIP). — 2014. — Pp. 281-285.
104. Said A, Pearlman W. A. A new, fast, and efficient image codec based on set partitioning in hierarchical trees // IEEE Transactions on Circuits and Systems for Video Technology. — 1996. — Vol. 6, no. 3. — Pp. 243-250.
105. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы (теория и практика). Глава 10. Внутрикадровое кодирование изображений. — Техносфера, 2012. — 290-313 pp.
106. Tested images. — https://github.com/tovoidcast/dwt_test_benchmark. — Accessed: 2020-05-14.
107. Shannon C. E. A mathematical theory of communication // The Bell System Technical Journal. — 1948. — Vol. 27, no. 3. — Pp. 379-423.
108. Huffman D. A. A Method for the Construction of Minimum-Redundancy Codes // Proceedings of the IRE. — 1952. — Vol. 40, no. 9. — Pp. 1098-1101.
109. DEFLATE. RFC 1951. — https://tools.ietf.org/html/rfc1951. — Accessed: 2020-10-03.
110. Rissanen J., Langdon G. G. Arithmetic Coding // IBM Journal of Research and Development. — 1979. — Vol. 23, no. 2. — Pp. 149-162.
111. Shahbahrami Asadollah, Bahrampour Ramin, Rostami Mobin Sabbaghi, Mo-barhan Mostafa Ayoubi. Evaluation of Huffman and Arithmetic Algorithms for Multimedia Compression Standards. — 2011.
112. Marpe D., Schwarz H., Wiegand T. Context-based adaptive binary arithmetic coding in the H.264/AVC video compression standard // IEEE Transactions on Circuits and Systems for Video Technology. — 2003. — Vol. 13, no. 7. — Pp. 620-636.
113. Zstandard (Facebook). — https://github.com/facebook/zstd. — Accessed: 2020-10-03.
114. LZFSE (Apple). — https://github.com/lzfse/lzfse. — Accessed: 2020-10-03.
115. DivANS (Dropbox). — https://github.com/dropbox/divans. — Accessed: 2020-10-03.
116. Asymmetric Numeral System implementation by Andrew Polar. — http://ezcodesample. com/abs/abs_article.html. — Accessed: 2020-05-14.
117. Cleary J., Witten I. Data Compression Using Adaptive Coding and Partial String Matching // IEEE Transactions on Communications. — 1984. — Vol. 32, no. 4. — Pp. 396-402.
118. Moffat A. Implementing the PPM data compression scheme // IEEE Transactions on Communications. — 1990. — Vol. 38, no. 11. — Pp. 1917-1921.
119. Willems F. M. J., Shtarkov Y. M., Tjalkens T. J. The context-tree weighting method: basic properties // IEEE Transactions on Information Theory. — 1995. — Vol. 41, no. 3. — Pp. 653-664.
120. Cormack Gordon V., Horspool R. Nigel. Data Compression Using Dynamic Markov Modelling // The Computer Journal. — 1986. — Vol. 30. — Pp. 541-550.
121. Burrows Michael, Wheeler David. Tech. Rep.: : DIGITAL SRC RESEARCH REPORT, 1994.
122. Г. Буяновский. Ассоциативное кодирование // Монитор. — 1994. — no. 8. — Pp. 10-19.
Приложение А
Акты внедрения основных результатов диссертационной работы
УТВЕРЖДАЮ Проректор'по научной работе, к.ф.-м.н.
Баган В.А. 2020 г.
АКТ
об использовании теоретических и практических результатов диссертационной работы Быстрова К.С. «Исследование и разработка видео кодека на основе многоканального вейвлет преобразования», представленной на соискание ученой степени кандидата технических наук, в учебном процессе на базовой кафедре мультимедийных технологий и телекоммуникаций МФТИ
В рамках дисциплины «Цифровые системы передачи информации», которая читалась студентам магистратуры МФТИ на базовой кафедре мультимедийных технологий и телекоммуникаций МФТИ в 2017-2018 годах, а также в рамках дисциплины «Теория кодирования мультимедийной информации», которая читается студентам бакалавриата МФТИ на базовой кафедре мультимедийных технологий и телекоммуникаций МФТИ, использованы теоретические и практические результаты диссертационной работы Быстрова К.С. «Исследование и разработка видео кодека на основе многоканального вейвлет преобразования». Среди них: математическая модель расчета банков фильтров многоканального вейвлет преобразования, программная реализация многоканального вейвлет видео кодека, математическая модель контекстов для энтропийного кодирования вейвлет-коэффициентов с помощью метода асимметричных систем счисления, математическая модель внутрикадровго предсказания в пространстве вейвлет-коэффициентов, программная реализация энтропийного ANS коэффициентов вейвлет-разложения изображений.
кодера
Зав. кафедрой мультимедийных технологий и телекоммуникаций
л!
A.B. Дворкович
УТВЕРЖДАЮ
АКТ
о внедрении теоретических и практических результатов диссертационной работы Быстрова К.С. «Исследование и разработка видео кодека на основе многоканального вейвлет преобразования», представленной на соискание ученой степени кандидата технических наук, при выполнении НИР, выполненных лабораторией мультимедийных
систем и технологий МФТИ
Теоретические и практические результаты диссертационной работы Быстрова К.С. «Исследование и разработка видео кодека на основе многоканального вейвлет преобразования», а именно, программная реализация многоканального вейвлет видео кодека, была использована в рамках выполнения НИР по проекту ПНИЭР «Разработка программных и технических средств для эфирных видеоинформационных систем вещания и связи массового и специального применения с использованием ограниченного частотного ресурса» рамках реализации федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно- технологического комплекса России на 2014 - 2020 годы», соглашение о предоставлении субсидии № 14.581.21.0015 от 16 октября 2015 г. между Министерством науки и высшего образования Российской Федерации и МФТИ.
Заведующий лабораторией мультимедийных
систем и технологий МФТИ
А.В. Дворкович
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.