Увеличение компрессии изображений в алгоритмах с фурье-преобразованиями тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат наук Голованов, Роман Вячеславович

  • Голованов, Роман Вячеславович
  • кандидат науккандидат наук
  • 2014, Москва
  • Специальность ВАК РФ05.13.11
  • Количество страниц 134
Голованов, Роман Вячеславович. Увеличение компрессии изображений в алгоритмах с фурье-преобразованиями: дис. кандидат наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. Москва. 2014. 134 с.

Оглавление диссертации кандидат наук Голованов, Роман Вячеславович

Содержание

Введение

1 Критерий оценки качества изображения

1.1 Проблема

1.2 Обзор существующих критериев

1.2.1. Пиковое отношение сигнал/шум (12). 1.2.2. Современные критерии оценки качества изображения (14)

1.3 Разработка новых математических критериев

1.3.1. Критерий сглаженных градиентов SGC (16). 1.3.2. Критерий сглаженной адаптации SAC (18). 1.3.3. Перспективы (19)

1.4 Тестирование критериев

1.4.1. Базы изображений (21). 1.4.2. Сравниваемые критерии (21). 1.4.3. Общепринятая методика тестирования (21). 1.4.4. Ранжирование по среднему месту (23). 1.4.5. Ранжирование по среднему PLCC (24). 1.4.6. Выводы (25)

1.5 Результаты главы

2 Базы тестовых изображений

2.1 Введение

2.1.1. Создание базы (27). 2.1.2. Рекомендации (28)

2.2 Обзор существующих баз

2.2.1. База TID2008 (31). 2.2.2. База LIVE (34)

2.3 Объединение баз

2.3.1. Экспертные и критериальные оценки (35). 2.3.2. Наглядная работа критерия качества (43). 2.3.3. Регрессии (48). 2.3.4. Объединение баз (50)

2.4 Тестирование критериев

2.5 Результаты тестирования

2.5.1. Сравнение по отношению стандартов (54). 2.5.2. Сравнение по коэффициентам корреляции (54). 2.5.3. Условные субъективные оценки (54)

2.6 Результаты главы

3 Улучшения кодека JPEG

3.1 Выбор направления

3.2 Стандартный кодек JPEG

3.2.1. Описание алгоритма (57). 3.2.2. Реализация программы (61)

3.3 Матрица квантования

3.3.1. Стандартный размер (61). 3.3.2. Произвольный размер (62). 3.3.3. Преимущество (63)

3.4 Алгоритм BigJPEG

3.4.1. Обоснование алгоритма (64). 3.4.2. Программная реализация (65). 3.4.3. Методика сравнения (66). 3.4.4. Анализ результатов (66). 3.4.5. Демонстрация на изображениях (71). 3.4.6. Выводы (86)

3.5 Алгоритм JPEG-IT

3.5.1. Описание (86). 3.5.2. Методика сравнения (87). 3.5.3. Анализ результатов (88). 3.5.4. Демонстрация на изображениях (90). 3.5.5. Выводы (95)

3.6 Результаты главы

4 Фурье-аппроксимация гладких непериодических функций

4.1 Проблема

4.2 Сходимость рядов Фурье

4.3 Одномерный случай

4.3.1. Эффект Гиббса (100). 4.3.2. Чётное продолжение (100). 4.3.3. Нечётное продолжение (100). 4.3.4. Дальнейшее повышение гладкости (101). 4.3.5. Простое продолжение высокой гладкости (101)

4.4 Двумерный случай

4.4.1. Классическое продолжение (107). 4.4.2. Чётное продолжение (108). 4.4.3. Нечётное продолжение (108)

4.5 Усечение ряда Фурье

4.5.1. Усечение по квадрату (109). 4.5.2. Усечение по треугольнику (110). 4.5.3. Оптимальное усечение (110). 4.5.4. Построение гиперболического усечения (112)

4.6 Нечётное продолжение в сжатии изображений

4.6.1. Чётное продолжение (115). 4.6.2. Простое нечётное продолжение (116). 4.6.3. Устранение блочного эффекта (117). 4.6.4. Нечётное продолжение со сглаживанием (117). 4.6.5. Результаты численных расчётов (118)

4.7 Обобщения

4.7.1. Сеточная функция (119). 4.7.2. Неравномерные сетки (119). 4.7.3. Гистограммы (119)

4.8 Результаты главы

Заключен ие

Список рисунков

Список таблиц

Литература

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Увеличение компрессии изображений в алгоритмах с фурье-преобразованиями»

Введение

Актуальность. Сжатие изображений. Задача обработки цифровых изображений возникла с развитием вычислительной техники во второй половине XX века. Аналоговый сигнал, полученный в каждом пикселе ПЗС матрицы, преобразовывается в цифровой формат. Ресурсные ограничения устройств требуют обработки, хранения и передачи цифровых изображений в как можно более компактном виде. Компактного представления изображений добиваются за счёт алгоритмов сжатия. Для обеспечения высокого сжатия зачастую приходится жертвовать качеством изображения. Каждое устройство предварительно настраивают на определённый уровень качества и сжатия получаемого изображения в зависимости от решаемых задач.

В современном обществе всё чаще приходится иметь дело с мобильными или стационарными пунктами фото или видео фиксации. Они позволяют вести учёт и контроль на обозреваемой территории в автоматическом режиме. Например, системы распознавания автомобильных номерных знаков активно внедряются на практике, что позволяет оперативно выявлять правонарушителя и вести учёт автотранспорта. В этом случае достаточно иметь качество изображения, гарантирующее считывание гос. номера транспортного средства.

Наряду с разработкой цифровых устройств для гражданских нужд, активно развивается военная отрасль. Беспилотная техника становится нормой в боевых условиях. Беспилотные летательные аппараты (БПЛА) используются для мониторинга ситуации в приграничных районах государства или над проблемной территорией. БПЛА активно применяют в разведке, рекогносцировке, целенаведении и других операциях. От скорости и качества передаваемой информации зависят принимаемые решения и, как следствие, исход военной или спасательной операции. Поэтому здесь даже незначительные улучшения в алгоритмах сжатия высоко ценятся.

Примеры снимков сделанных с космических спутников часто встречаются в прессе. Весной 2014 года бесследно пропал "Боинг" с 239 пассажирами на борту, следовавший из Куала-Лумпур в Пекин. Были обнародованы некоторые снимки, полученные с китайского военного спутника, приведённые на Рис. 1. Утверждалось, что на них возможно изображены обломки пропавшего самолёта. Хорошо видно, что качество снимков посредственное, а обломки на изображении могут быть чем угодно.

Проблемы сжатия изображений сейчас активно исследуются в научной литературе. Сжатие достигается за счёт естественной избыточности изображения. Выделяют три вида избыточности: визуальная, межэлементная и кодовая. Визуальная избыточность связана с особенностями человеческого восприятия изображения. Межэлементная избыточность возникает из-за естественной близости яркостей соседних точек и, как следствие, высокой коррелированности. Кодовая избыточность возникает из-за неравномерного распределения уровней яркости изображения.

Самым распространённым среди алгоритмов сжатия изображений является кодек JPEG, основанный на дискретном косинусном преобразовании (ДКП). Это было достигнуто за счёт относительной простоты реализации и разработки международного стандарта (ISO/IEC 10918-1) Он был предложен около 20 лет назад. С тех пор ведутся много-

Рисунок 1 — Снимки возможных обломков пропавшего самолёта, сделанные китайским

военным спутником

численные научные исследования по совершенствованию характеристик этого кодека, но серьёзного выигрыша получить не удаётся. Поэтому разработка улучшенных алгоритмов сжатия на основе ДКП является актуальной.

Оценка качества изображений. В настоящее время существуют и другие кодеки сжатия. Чаще всего кодеку JPEG противопоставляют другой способ сжатия, основанный на вейвлет-преобразовании. Он лёг в основу кодека JPEG2000, описанного в международном стандарте в 2000 году (ISO/IEC 15444-1). До сих пор этот стандарт не стал общепринятым. Одна из причин — сложность реализации алгоритма, как программная, так и аппаратная. Другая — противоречивые результаты сравнения кодеков JPEG2000 и JPEG.

Некоторые исследователи, сравнивая кодеки JPEG и JPEG2000, утверждают, что последний обеспечивает несколько лучшее качество изображения при той же степени сжатия. Однако при этом качество оценивают условной величиной относительной погрешности в норме L-2, называя её пиковым отношением сигнал/шум (ПОСШ). Напротив, если качество оценивают визуально, то выигрыш даёт кодек JPEG. Получается, что об-

щепринятый математический критерий оценки качества не согласуется с человеческим восприятием. Эти противоречивые результаты дали развитие новому направлению. В последние годы активно ведутся разработки новых математических критериев оценки качества искажённого изображения. В настоящее время существуют десятки альтернативных критериев.

Разработка критерия — очень сложная задача. Необходимо строить математическую модель зрительной системы человека (HVS — human visual system). Для проверки достоверности предсказания качества изображений, получаемых такими критериями, подготавливают специальные базы тестовых изображений. Для каждого искажённого изображения получена усреднённая экспертная оценка качества. По зависимости значений критерия и экспертных оценок судят о достоверности критерия.

В современном мире область применения математических критериев оценки качества изображений оказывается весьма многообразной. Их используют не только для оценки работы алгоритмов обработки изображений, но и внедряют в автоматизированные системы. Такие системы в реальном времени позволяют адаптировать работу алгоритма сжатия изображения в зависимости от загруженности каналов связи. В настоящий момент нет общепринятого критерия оценки качества искажённого изображения. Современные критерии далеки от адекватной передачи человеческого восприятия. Поэтому актуальной задачей является разработка новых математических критериев для оценки качества изображений.

Основные трудности в сжатии или оценке качества возникают в чёрно-белых изображениях. Поэтому рассматриваемые и предлагаемые в данной работе алгоритмы рассчитаны на работу только с чёрно-белыми изображениями. В дальнейшем эти алгоритмы можно достаточно просто обобщить на работу с цветными изображениями.

Заметные успехи в области алгоритмов сжатия и критериев оценки качества изображения достигнуты в работах Умняшкина C.B. (НИУ «МИЭТ»), Дворковича В.П. и Дворковича A.B. (МГТУ им. Баумана), Бехтина Ю.С. (РГРТУ), Хрящёва В.В. (ЯрГУ им. Демидова), Радченко Ю.С. (ВСУ) и других. В зарубежных работах значимых результатов достигли Лукин В.В. и Пономаренко H.H. (НАУ им. Н.Е. Жуковского «ХАИ», Украина, Харьков), Егиазарян К. и Astola J. (Финляндия, Тампере), Zou Wang (Канада, Ватерлоо) и другие.

Предметная область. Исследование ведётся в нескольких смежных областях, соответствующих паспорту специальности 05.13.11:

1. Моделирование, разработка методик и алгоритмов для цифровой обработки изображений.

2. Оценка качества работы алгоритмов сжатия изображений.

Предметами исследования являются алгоритмы дискретного преобразования Фурье для сжатия изображений с потерями и критерии оценки качества получаемого изображения посредством таких алгоритмов.

Цель и задачи. В диссертации разрабатываются улучшенные методы компрессии цифровых изображений на основе контекстного кодирования в области дискретного косинусного преобразования.

Для достижения цели были поставлены и решены следующие научно-технические задачи:

1. Разработка алгоритма адаптивного кодирования в кодеках на основе дискретного косинусного преобразования (ДКП).

2. Обобщение алгоритмов сжатия изображений на основе ДКП на блоки произвольного размера.

4. Повышение достоверности методов тестирования алгоритмов на базах изображений с различными видами искажений.

Методы исследования. В ходе работы над диссертацией использовались теоретические и экспериментальные методы. Теоретическими являются теория вероятностей и математической статистики, теории цифровой обработки сигналов и кодирования данных, линейной алгебры, математического анализа, численных методов.

В ходе исследования производилось численное моделирование на компьютере с использованием написанных и доработанных приложений на языках С и С++, а также пакета MATLAB.

Эксперимент состоял в сравнении результатов теоретических расчётов с экспертными оценками, взятыми из современных баз тестовых изображений.

Достоверность результатов, научных положений, выводов и рекомендаций подтверждается использованием для их получения общепринятых научных подходов и методов разработки, а также результатами численных экспериментов. Расчёты, проведённые с использованием наборов стандартных тестовых изображений, подтверждают, что использованные алгоритмы оценки качества искажённого изображения статистически достоверны и соответствуют человеческому восприятию.

Преимущество созданных методов и алгоритмов сжатия цифрового изображения оценивалось с использованием известных критериев качества.

Личный вклад автора. В основу диссертации легли результаты исследований, выполненных лично автором. Личный вклад автора состоял также в непосредственном участии в получении исходных данных, в аппробации результатов исследований, в обработке и интерпретации полученных данных, в подготовке основных публикаций по выполненной работе.

Научная новизна. В работе предлагаются следующие новые алгоритмы, методы и программы.

1. Предложен алгоритм BigJPEG, обобщающий кодек JPEG на блоки большего размера, и его программная реализация.

2. Предложена экономичная схема кодирования JPEG-IT для базового кодека JPEG и её программная реализация.

3. Создан критерий оценки качества изображения, построенный на основе нормы Соболева.

4. Предложен метод объединения баз тестовых изображений, построенных на основе разнотипных экспертных оценок.

5. Разработана методика сравнения критериев оценки качества изображения и определение лучшего среди них.

6. Проведено сравнение алгоритмов сжатия изображений на основе лучшего по достоверности современного критерия оценки качества изображения. Практическая значимость:

1. Разработанные кодеки BigJPEG и JPEG-IT, повышающие сжатие изображений от 9 до 20%, целесообразно использовать для хранения и передачи изображений в условиях технических ограничений аппаратуры.

2. Предложенная методика сравнения критериев оценки качества изображений на объединённой базе, может быть использована для статистически достоверного ранжировать критерии качества и выбора лучшего из них.

3. Предложенный критерий оценки качества изображения SGC, может быть использован для ускорения процесса тестирования алгоритмов обработки изображений. Основные положения, выносимые на защиту:

1. Разработанные кодеки BigJPEG и JPEG-IT повышают сжатие изображений от 9 до 20% при том же качестве по сравнению с базовым кодеком JPEG.

2. Предложенная методика сравнения критериев оценки качества изображений на объединённой базе позволяет достоверно ранжировать критерии качества и оценивать их доверительную вероятность.

3. Предложенный критерий оценки качества изображения, сопоставим по достоверности с лучшими современными критериями, но существенно превосходит их по простоте реализации.

Апробация. Основные результаты работы докладывались на 15-й Международной конференции «Цифровая обработка сигналов и её применение» (Москва, 2013 г.), на 19-ой, 20-ой и 21-ой Всероссийских межвузовских научно-технических конференциях студентов и аспирантов «Микроэлектроника и информатика» (Москва, МИЭТ, 2012, 2013 и 2014 гг.), на научном семинаре ЗАО «ЭЛВИС-НеоТек» (Москва, Зеленоград, 2013 г.), на научном семинаре ФТИАН (Москва, 2014 г.).

Публикации. По теме диссертации опубликовано 9 работ, в том числе 5 статей в журналах, рекомендованных ВАК: «Доклады Российской академии наук» — 2, «Цифровая обработка сигналов» — 1 и «Математическое моделирование» — 2. Получено 2 свидетельства о государственной регистрации программы для ЭВМ.

Структура и объём диссертации. Диссертация состоит из введения и четырёх глав, изложена на 134 страницах, содержит 101 рисунок и 16 таблиц. Список литературы насчитывает 94 источника.

Глава 1

Критерий оценки качества изображения

1.1 Проблема

Стандартное чёрно-белое изображение является матрицей. Каждый пиксель матрицы характеризуется яркостью, которой приписывается целое число от 0 до 255. Эта кодировка требует всего 8 бит на пиксель, а число уровней яркости достаточно для чувствительности зрительной системы человека. В [1] подробно описано, как определяется величина минимального изменения яркости воспринимаемой человеком. Приводятся результаты экспериментов, подтверждающие, что в естественных условиях человек способен различить 232 градации яркости.

При передаче изображения по каналам связи возникают различные искажения. Часть из них связана с техническими сбоями каналов связи (в числе которых может быть передача по бескабельным каналам связи). Другая часть намеренно вводится при сжатии изображения, если требуется существенно уменьшить количество передаваемой информации. В обоих случаях в искаженном изображении вместо истинной яркости гг-го пикселя хп будет стоять изменённое число уп (также целое и лежащее в тех же пределах).

Пользователь или автоматизированная система получает искаженное изображение Y, по которому необходимо судить об исходном изображении X. Разработка, как аппаратуры, так и способов сжатия с потерями направлены на получение достаточно хорошего качества переданного изображения. При тестировании такой работы можно предложить пользователю большой набор исходных изображений и переданных искажённых изображений, чтобы пользователь визуально оценил качество. Для аккуратного тестирования необходимо привлекать большую группу испытуемых и чётко регламентировать процедуру сравнения. Это очень трудоёмкая и дорогостоящая работа, аналогичная экспериментам в физике и технике. Каждый раз, когда предложена новая аппаратура или новый метод обработки изображений, такую процедуру необходимо проводить заново.

Поэтому на практике действуют следующим образом. Создают базу эталонных и искаженных изображений. Это могут быть, как естественные изображение, так и специализированные для конкретной области применения. Для них один раз выполняют экспертную оценку качества изображений ks{X,Y). Далее по массивам хп и уп пытаются построить некоторый критерий оценки качества изображения (IQA — image quality assessment) — математическую функцию от массивов яркостей км(Х,У). Если ухудшению экспертной оценки соответствует убывание этой функции, то данной метрикой качества можно успешно пользоваться в конструкторско-исследовательской работе вместо проведения новых экспертных оценок. Это очень важно, например, при разработке медицинского оборудования или военной техники (см. примеры 1.1.1-1.1.3).

Пример 1.1.1. Рентгеновские аппараты используют при исследование кровеносной системы человека. Визуализация сердечно-сосудистой системы пациента выполняется методом ангиографии, когда контрастное вещество подсвечивает сосуды на фоне тканей внутренних органов. На снимке во многих случаях сосуды оказываются слабо отличающимися от других тканей (см. пример снимка на Рис. 1.1). Лишь опытный специалист сможет работать с такими снимками. Актуальной стала разработка специальных методов, которые позволяют из серии рентгеновских снимков делать результирующий, на котором остаются только характерные детали [2]. Очевидно, что использование математических критериев 1<ЗА может серьёзно упростить процедуру верификации алгоритмов. В таких случаях необходимо разрабатывать узкопрофильный критерий, привлекая квалифицированных и опытных экспертов. Это позволит проводить проверки алгоритмов обработки медицинских изображений [3].

Рисунок 1.1 — Пример рентгеновского снимка сосудов головного мозга человека

Пример 1.1.2. В военной технике активно ведутся разработки беспилотных летательных аппаратов (БПЛА). Их используют при аэрофотосъёмке местности. Полученную серию снимков объединяют, получая тем самым карту местности. Типовой проблемой в таком случае является проявление артефактов на границах снимков. Для устранения подобных дефектов разрабатывают специальные алгоритмы, которые позволяют производить аккуратную «сшивку» кадров или делать постобработку «сшитого» изображения [4] (см. пример на Рис. 1.2). От качества изображения может зависеть результат разведывательной операции. В условиях военных действий это является очень важным.

Пример 1.1.3. В обычных условиях БПЛА может ориентироваться в воздухе по сигналам с датчиков спутниковой навигационной системы ГЛОНАСС или GPS и автономно следовать заданному маршруту. Управляющие сигналы также могут передаваться по каналу радиосвязи из командного центра. В боевых условиях противник может использовать средства радиопомех, так что БПЛА будет дезориентирован, а связь с ним потеряна.

Поэтому другая актуальная задача — это обеспечение автономного перемещения БПЛА. Летательный аппарат должен уметь следовать маршруту по опорным точкам на местности. Опорные точки — это характерные объекты местности, такие как здания, дороги, мосты и естественный ландшафт. Их можно использовать для определения координат и параметров движения [5]. БПЛА делает снимок, далее алгоритм обработки изображения должен выделить опорные участки и вычислить координаты и параметры движения (см. пример на Рис. 1.3). Каждый раз запускать БПЛА и проверять работу

Рисунок 1.2 — Пример создания бесшовного изображения по снимкам с БПЛА

алгоритмов — слишком дорого. Поэтому такие алгоритмы проще верифицировать специально построенными математическими моделями, а критерий К^А должен использоваться для определения приемлемого сочетания качество-сжатие. Это позволит экономить ресурсы самого БПЛА и упростит процедуру тестирования алгоритмов.

Рисунок 1.3 — Пример работы алгоритма поиска опорных точек по снимкам с БПЛА

Однако построить критерий 1<ЗА оказывается не просто. Этому вопросу посвящена обширная литература [6-10] и др. Обычно исследователи исходят из некоторых естественных идей и пишут достаточно простые критерии. На практике они не очень хорошо совпадают с экспертными оценками. Их начинают усложнять, причем довольно эклектичным образом и при этом вводят ряд свободных (подгоночных) параметров. Итоговые формулы зачастую оказываются весьма громоздкими. Получаются искусственные конструкции, хорошо работающие на той базе экспертных оценок, по которой подбирались их свободные параметры. На других базах результаты могут быть заметно хуже.

Для тестирования критериев IQA созданы различные базы тестовых изображений [11-16]. Обычно одному оригиналу соответствует несколько искажённых изображений, для которых известна экспертная оценка. На таких базах производится тестирование критериев и делаются выводы о достоверности получаемых результатов.

1.2 Обзор существующих критериев

Разработка критериев IQA (image quality assesment — оценка качества изображения) — это относительно новая область исследований. Активные работы в данном направлении ведутся с начала 2000-х годов [6,9, 10, 17, 18]. Поскольку в большинстве случаев человек является конечным пользователем алгоритмов обработки и передачи изображений, то самый надёжный способ оценки качества изображений — это субъективная оценка. Действительно, средняя экспертная оценка (MOS — mean opinion score) давно признана лучшим способом измерения качества изображения. Однако сбор экспертных оценок , как правило, занимает много времени и дорог.

Задача разработки критерия IQA заключается в разработке математической модели, которая способна предсказывать воспринимаемое качество изображения точно и без настроек на конкретную ситуацию. Алгоритм должен прогнозировать то качество изображения, которое в среднем сообщает эксперт. Успешное развитие таких критериев оценки имеет большую перспективу во многих прикладных задачах. Например, в автоматизированных системах передачи изображений или видео. Система автоматически подбирает приемлемое качество в зависимости от загруженности линий связи. Другая область — это тестирование алгоритмов обработки изображений. К ним относятся алгоритмы сжатия, шумоподавления, повышения качества, стеганографии и другие.

1.2.1. Пиковое отношение сигнал/шум. Самый простой и, к сожалению, всё ещё широко распространённый критерий IQA — среднее квадратичное отклонение (СКО) или mean opinion score (MSE), которое определяется по формуле

где хг и /у, — яркости соответствующих пикселей изображения X и Y, N — общее число пикселей в изображении. Чаще используют величину пикового отношения сигнал/шум (ПОСШ) или peak signal-noise ratio (PSNR), основанный на MSE

где Ь — максимальное значение яркости пикселя в данном изображении. Для 8-битного изображения Ь = 255.

Метрики (1.1) и (1.2) вычисляются просто. К тому же М5Е имеет понятное физическое определение — это энергия ошибки в сигнале. Тем не менее, М5Е и PSNR уже давно критикуют за плохую связь с воспринимаемым качеством изображения. Простой пример из [10] показан на Рис. 1.4. Изображения (а)-^) имеют одинаковый М5Е, тем не менее визуально они сильно отличаются. В то же время изображения (Ь)-(_|) воспринимаются одинаково, хотя значения М5Е существенно отличаются.

(1.1)

PSNR =10 log

Lr

(1.2)

MSE

<а)

(b) MSE = 309

(с) MSE = 306

(d) M5E = 313

(e> MSE = 309

(f ) MSE = 308

{g) MSE = 309

(h) MSE = 871 (i) MSE = 694 {j) MSE = 590

Рисунок 1.4 — Изображения Einstein с наложением различных искажений: (а) оригинальное, (Ь) сдвиг средней яркости, (с) увеличение контраста, (d) импульсный шум, (е) белый гауссов шум, (1) размытие, (g) сжатие JPEG, (h) сдвиг, (i) увеличение,

(j) поворот

Вопрос об использовании МБЕ поднимался уже довольно давно [19]. МБЕ не вполне соответствует человеческому восприятию качества изображения. Человеческое зрение обладает многими психофизическими и психологическими особенностями, которые трудно учесть в математическом критерии. В [20] описаны связи между основными факторами

визуального восприятия и процесс зрительного мышления человека с точки зрения психологии. Все эти факторы трудно учесть в формальном критерии IQA. Тем не менее на данный момент предпринято множество попыток построить модели зрительной системы человека (IIVS — human visual system) Рассмотрим наиболее популярные разработки.

1.2.2. Современные критерии оценки качества изображения.

UQI — universal quality index. Среди первых разработок быстро набрал популярность «универсальный индекс качества изображения» (UQI) [17]. Под словом «универсальный» авторы понимают то, что методика оценки качества не зависит от тестируемого изображения, от условий наблюдения или индивидуальных особенностей зрителя.

Этот критерий имеет более сложное устройство в сравнении с MSE. Метрика UQI — это комбинация трёх различных факторов:

uqi = . . (|.з,

У

охОу (:/;)- + (УУ о-'у + <т.

где х и у — значения средней яркости оригинального и искажённого изображений, и <7у — несмещённая дисперсия яркости тех же изображений, а ату — ковариация яркости (линейная зависимость яркости двух изображений). В общем виде два произвольных фактора (множителя) содержат свой вес (показатель степени), который по умолчанию = 1.

Первый множитель в (1.3) определяет корреляцию яркости двух изображений. Второе слагаемое определяет близость средней яркости изображений, а третий — подобие контрастов изображений. Вычисления делаются скользящим окном (рекомендуемый размер — 8x8 пикселей) по всему изображению по формуле (1.3). Результаты каждого окна суммируются и усредняются. Полученное число является оценкой качества изображения У в сравнении с изображением X. Каждый из множителей имеет свой вес, хотя разработчики рекомендуют использовать одинаковые веса для каждого множителя. Поэтому данный критерий имеет 3 свободных параметра: веса двух множителей и размер скользящего окна.

На момент публикации критерия и<31 не было хороших наборов тестовых изображений. В небольшом эксперименте [17], было показано превосходство новой разработки над МБЕ.

SSIM — Structural SIMilarity. Авторы UQI продолжили работы в этом направлении и через некоторое время был опубликован новый критерий SSIM — «индекс структурного подобия» [18]. Эта разработка идейно основана на метрике UQI. Значения SSIM определяются следующей формулой

SSIM = .f^ + f---2о^ + я , (1.4)

(ж)" + {у)~ + с <гх* + <V + s

где с и л — это подгоночные параметры. Остальные величины соответствуют (1.3). Вычисления делаются скользящим окном аналогично UQI.

Техника тестирования критериев IQA становится более системной и критерии UQI и SSIM проходят более «жёсткий» отбор. Тестирование делается на большем наборе изображений с различными видами искажений. Сравнение критериев показывает превосходство SSIM над UQI. По реализации они сопоставимы, но последний уже содержит 5 подгоночных параметров: 3 из UQI и ещё два дополнительных..

MSSIM — multi-scale structural similarity. Улучшенная версия SSIM была анонсирована в [21]. Предлагается многоуровневый критерий структурного подобия — MSSIM. Идея состоит в том, чтобы учитывать расхождения в крупных и мелких масштабах (деталях) с различными коэффициентами значимости. Алгоритм наглядно показан на Рис. 1.5.

Рисунок 1.5 — Схема работы алгоритма МЭБШ. Ь: фильтр нижних частот, 24,:уменьшение изображения в 2 раза

На схеме видно, что изображение разбивается на M уровней. При переходе на следующий уровень применяется низкочастотный фильтр и делается передискретизация изображения. То есть на каждом уровне получается изображения содержащие в 2 раза меньше пикселей по вертикали и по горизонтали. Для каждого изображения вычисляется SSIM по (1.4). Итоговая оценка вычисляется как комбинация значений SSIM, полученных на разных уровнях.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Список литературы диссертационного исследования кандидат наук Голованов, Роман Вячеславович, 2014 год

Литература

1. Быков Р.Е. Теоретические основы телевидения. Учеб. для вузов. — Спб.: Издательство «Лань», 1998. - С. 288.

2. Афанасенко А.С. Выделение и отслеживание характерных деталей на рентгеновском изображении // Труды 15-й международной конференции DSPA-2013. — Москва, Россия. - 2013. - С. 66-70.

3. Лукин А.С., Сторожилова М.В., Юрин Д.В. Методы анализа качества фильтрации шума на изображениях компьютерной томографии // Труды 15-й международной конференции DSPA-2013. - Москва, Россия. - 2013. - С 85-88

4. Новиков Д.С., Фаворская М.Н. Устранение артефактов сшивки на ландшафтном аэрофотоснимке // Труды 15-й международной конференции DSPA-2013. — Москва, Россия. - 2013. - С 6-10.

5. Алпатов Б.А., Стротов В.В., Фельдман А.Б. Распознавание и прослеживание опорных участков местности для определения координат и курса беспилотного летательного аппарата // Труды 15-й международной конференции DSPA-2013. — Москва, Россия. - 2013. - С. 6-10.

6. Osberger IV. Perceptual Vision Models for Picture Quality Assessment and Compression Applications. Ph.D. thesis. — Queensland University of Technology. — 1999.

7. On between-coefficient contrast masking of DCT basis functions / N. Ponomarenko, F. Silvestri, K. Egiazarian et al. // CD-ROM Proc. of the Third Int. Workshop on Video Proc. and Quality Metrics. - USA. - 2007. - P. 4.

8. New full-referencc quality metrics based on HVS / K. Egiazarian, J. Astola, N. Ponomarenko et al. // CD-ROM Proceedings of the Second International Workshop on Video Processing and Quality Metrics. — Scottsdale, USA. — 2006. — P. 4.

9. Sheikh H.R., Bovik A.C. Information Theoretic Approaches to Image Quality Assessment.

- Elsevier, 2005. - C. 368.

10. Wang Z., Bovik A.C. Modern Image Quality Assessment. — Morgan & Claypool, 2006.

- С 146

11. Metrics performance comparison for color image database / N. Ponomarenko, F. Bat-tisti, K. Egiazarian et al. // in Proc. 4th Int. Workshop Video Process. Quality Metrics Consum. Electron. — Scottsdale, AZ. — 2009. — 1.

12. Sheikh. H., Seshadrinathan K., Moorthy A. K. et al. Image and video quality assessment research at LIVE. — 2006. — 6. URL: http'//live.ece.utexas.edu/research/quality/.

13. Larson E.C., Chandler DM. Most apparent distortion: full-reference image quality assessment and the role of strategy // Journal of Electronic Imaging. — 2010. — 3.

- T. 19, № 1.

14. Ninassi Le Callet P., Autrusseau F. Pseudo no reference image quality metric using perceptual data hiding // in Proc. SPIE: Human Vis. Electron. Imag. — San Jose, CA

- 2006. - 1.

15. Horita Y., Shlbata K., Kawayoke Y. et al. MICT image quality evaluation database. URL: http://mict.eng.u-toyama.ac.jp/mictdb.html.

16. Chandler D.M., Hemami S.S. VSNR: A visual signal-to-noise ratio for natural images based on near-threshold and suprathreshold vision. — 2007. URL: http://foulard.ece.cornell.edu.

17. Wang Z., Bovik A C. A Universal Image Quality Index // IEEE Signal Processing Letters.

- 2002. - T. 9, № 3. - C. 81-84.

18. Image Quality Assessment: From Error Visibility to Structural Similarity / Z. Wang, A. Bovik, H. Sheikh et al. // IEEE Transactions on Image Processing. — 2004. — Vol 13, no 4. - P 600-612.

19. Girod B. What's wrong with mean-squared error // MA: MIT Press — Cambridge. — 1993 - C. 207-220

20. Gregory R. L. The intelligent eye. - Wiedenfeld and Nicolson, 1970. - C. 232.

21. Wang Z., Sitnoncelli E.P., Bovik A.C. Multi-scale structural similarity for image quality assessment // Proceedings of the 37th IEEE Asilomar Conference on Signals, Systems and Computers. — Pacific Grove, CA. — 2003. — 11.

22. Wang Z., Qiang L. Information content weighting for perceptual image quality assessment // IEEE Transactions on image processing — 2011. — T. 20, № 5. — C. 1185-1198.

23. Sheikh II.R., Bovik A.C. Image information and visual quality // IEEE Transactions on image processing. - 2006. - T. 15, № 2. - C. 430-444.

24. Perceptual data hiding exploiting between-coefficient contrast masking / S Marano, F. Battisti, A. Vaccari et al // Image Processing- Algorithms and Systems VI — 2008.

- Vol 6812. - P. 17-33.

25. Watson А.В., Solomon J.A. Model of visual contrast gain control and pattern masking // J. Opt. Soc. Am. A. - 1997. - T. 14, № 9. - С 2379-2391.

26. Modified Image Visual Quality Metrics for Contrast Change and Mean Shift Accounting / N. Ponomarenko, O. Ieremeiev, V. Lukin et al. // Proceedings of CADSM. — Ukraine.

- 2011 - 2. - P 305-311.

27. Gaubatz M. Metrix MUX Visual Quality Assessment Package. URL: http://foulard.ece.cornell.edu/gaubatz.

29,

30,

31

32,

33,

34,

35,

36.

37.

38.

39.

40.

41.

42,

43.

Wang Z., Qiang L. Information Content Weighting for Perceptual Image Quality Assessment // IEEE Transactions on Image Processing. — 2011. — 5. — T. 20, № 5. — С pp. 1185-1198.

Калиткин Н.И., Голованов P.В. Проблема сравнения критериев оценки качества искажённого изображения // Труды 15-й международной конференции DSPA-2013. — Москва. - 2013. - 3. - С. 31-34.

Голованов Р.В., Калиткин Н.Н. Программный комплекс SGC для оценки качества искажённого изображения на основе сглаженных градиентов // Свидетельство о государственной регистрации программы для ЭВМ № 2014616696. — 02.07.14.

Берзрядин С.И., Буров П.А., Ильиных Д.Ю. Преобразование контраста в программном обеспечении // KWE Int. Inc. — 2006.

Chandler D.M. Seven Challenges in Image Quality Assessment: Past, Present and Future Research // ISNR Signal Processing. - 2013. - T. 2013. - C. 1-53.

Chandler D. M., Hemami S.S. VSNR: A Wavelet-Based Visual Signal-to-Noise Ratio for Natural Images // IEEE Transactions on Image Processing. — 2007. — T. 16, № 9. — C. 2284-2298.

Sheik H.R., Bovik A.C., Vaciana G. An Information Fidelity Criterion for Image Quality Assessment Using Natural Scene Statistics // IEEE Transactions on Image Processing.

- 2005. - T. 14, № 12. - C. 2117-2128.

Mannos J., Sakrison D. A weighting appropriate to the human visual system. URL: http://signal.ece.utexas.edu/software/.

Image Quality Assessment Based on a Degradation Model / N. Damera-Venkata, T. Kite, W. Geisler [и др.] // IEEE Transactions on Image Processing. — 2000 — T. 9, № 4. — C. 636-650.

Kendall M.G. Rank Correlation Methods. — London: Griffin, 1970.

Color Image Database TID2013: Peculiarities and Preliminary Results / N. Ponomarenko, O. leremeiev, V. Lukin et al. // Proceedings of 4th Europian Workshop on Visual Information Processing EUVIP2013. - Paris, France. - 2013 - P. 106-111.

A New Color Image Database TID2013: Innovations and Results / N. Ponomarenko, O. leremeiev, V. Lukin et al. // Proceedings of ACIVS. — Paris, France. — 2013. — P. 402-413.

Kodak. Kodak Lossless True Color Image Suite. — 1999. URL:

http://rOk.us/graphics/kodak/.

Использование базы TID2008 при разработке метрик визуального качества и методов обработки изображений / С.К. Абрамов, А.Л. Зеленский, В.В. Лукин [и др.] // Компьютерные системы и информационные технологии — 2012. — Т. 56, № 4. — С. 99-109.

Голованов Р.В., Калиткин Н.Н. Статистическая недостоверность всех известных критериев оценки качества искажённого изображения // Цифровая обработка сигналов.

- 2013. - № 3. - С. 74-79.

44. Wallace G. The JPEG still picture compression standard // Comm. of the ACM. — 1991.

- T. vol. 34, №>4.

45. Умняшкин С.В., Космач М.В. Оптимизация кодирования цифровых изображений по методу JPEG // Известия вузов. Электроника. — 2000. — № 4. — С. 139-141.

46. Умняшкин С.В. Использование контекстного арифметического кодирования для повышения сжатия данных по схеме JPEG // Известия вузов. Электроника. — 2001. — № 3. - С. 96-99.

47. Стрелков Ф.В., Умняшкин С.В. Контекстное кодирование коэффициентов дискретного косинусного преобразования (ДКП) в JPEG-подобной схеме компрессии // Цифровая обработка сигналов. — 2003. — № 2. — С. 5-10.

48. Умняшкин С.В., Безуглова Е.А. Контекстное кодирование коэффициентов дискретного косинусного преобразования на основе межблочной корреляции в JPEG-подобной схеме компрессии // Цифровая обработка сигналов. — 2004. — J4b 2. — С. 13-17.

49. Умняшкин С.В., Курина В.В. Алгоритм сжатия изображений на основе дискретного псевдокосинусного преобразования // Цифровая обработка сигналов. — 2009. — № 3.

- С. 2-7.

50. Ebrahimi F., Chamik М., Winkler S. JPEG vs. JPEG2000: An Objective Comparison оГ Image Encoding Quality // Proc of SP1E - 2004. - T. 5558. - C. 300-308.

51. Comparison of lossy compression technique performance for real life color photo images / N. Ponomarenko, V. Lukiti, K. Egiazarian et al. // Picture Coding Symposium: Proc. of int. symp. - Chicago (USA). - 2009. - P. 4.

52. Performance Analysis of Visually Lossless Image Compression / N. Ponomarenko, A. Zemlyachenko, V. Lukin et al. // VPQM: Proc. of int. conf. - Scottsdale (USA). -2012. - P. 6.

53. Fenwick P. Punctured Elias Codes for variable-length coding of the integers // Technical Report 137. — Department оГ Computer Science. - The University of Auckland. — 1996

54. Беляев И.А. СФ-блок кодирования Хаффмана для сжатия изображений по стандарту JPEG // Проблемы разработки перспективных микро- и наноэлектроппых систем. — Сборник трудов / под общ. ред. академика А.Л.Стемпковского. М.:ИППМ РАН. — 2010. - С. 332-335.

55. Lane Т. libjpcg С source code. — 2006. URL: http://libjpeg.sourceforge.net.

56. Group Independent JPEG. JPEG С source code. — 2014. URL: http://www.ijg.org.

57. Cooley J.W., Tukey J.W. An algorithm for the machine calculation of complex Fourier series // Mathematics oi Computation. - 1965. - T. 19. — C. 297-301.

58. Wallace G.K. The JPEG algorithm for image compression standard // Communications of the ACM. - 1991. - T. 34, № 4. - C. 30-44.

59. Голованов P.В., Калиткин H.H. Программный комплекс BigJPEG для компрессии-декомпрессии изображений с разбиением на блоки большой размерности // Заявка на получение свидетельства о государственной регистрации программы для ЭВМ № 2014614202. — 07.05.14.

60.

61.

62.

63.

64.

65.

66.

67.

68.

69.

70.

71.

72.

73.

74.

75.

76.

77.

78.

Голованов Р.В. Программный комплекс JPEG-IT для компрессии-декомпрессии изображений с особым кодированием начального треугольника // Свидетельство о государственной регистрации программы для ЭВМ № 2014616697. — 02.07.2014.

Калиткин Н.Н. Численные методы. — БХВ-Петербург, 2011. — С. 592.

Самарский А.А. Введение в численные методы. — Наука, 1987. — С. 286.

Самарский А.А. Численные методы. — Наука, 1989. — С. 430.

Марчук Г.И. Методы вычислительной математики. — Наука, 1989. — С. 592,

Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы. — Бином, 2004. — С. 636.

Gibbs J. Fourier's series 11 letter in Nature. - 1898. - T. 59. - C. 200.

Gibbs J. Fourier's series // letter in Nature. — 1899. — T. 59. — C. 606.

Ахмед H., Pao К. Ортогональные преобразования при обработке цифровых сигналов: Пер. с англ. — «Связь», 1980.

Калиткин Н.Н., Кузьмина JI.B. Аппроксимация и экстраполяция табулированных функций // Доклады Академии наук. — 2000. — Т. 374, № 4. - С. 464-468.

Калиткин Н.Н., Луцкий К.И. Оптимальные параметры метода двойного периода // Математическое моделирование. — 2007. — Т. 19, № 1. — С. 57-68.

Крылов А.Н. О приближенных вычислениях. Лекции, читанные в 1906 г. — Спб. Типилитогр. К. Беркенфельда, 1907. — С. 228.

Малиев А.С. О разложении в ряды Фурье повышенной сходимости функций, определенных в данном промежутке // Известия Академии наук СССР. — 1933. — Т. 7, № 8. - С. 1113-1120.

Ланцош A.M. Практические методы прикладного анализа. — Гос. издат. физ.-мат. литературы, 1961. — С. 524.

Нерсесян А.В. Квазиполиномы типа Бернулли и ускорение сходимости рядов Фурье кусочно-гладких функций // Вычислительная математика. —- 2004. — Т. 4.

Eckhoff K.S. Accurate and efficient reconstruction of discontinuous functions from truncated series expansions // Mathematics of computation. — 1993. — 'Г. 61, № 204.

- C. 745-763.

Eckhoff K.S. On discontinuous solutions of hyperbolic systems // Comput. Methods Appl. Mech. Engrg. - 1994. - T. 116. - C. 103-112.

Eckhoff K.S. Accurate reconstructions of functions of finite regularity from truncated Fourier series expansions // The Mathimatics of Computation. — 1995. — T. 64, № 210.

- C. 671-690.

Eckhoff K.S., Rolfsnes J.H. On nonsmooth solutions of linear hyperbolic systems // J. Сотр. Phys. - 1996. - T. 125. - C. 1-15.

79. Gottlieb D., Shu C-W. On the Gibbs phenomenon II: Resolution properties of the Fourier' method for discontinuous waves // Comput. Methods Appl. Mech. Engrg. — 1994. — T.

116. - С 27-37.

80. Gottlieb D., Shu C-W. On the Gibbs phenomenon IV: Recovering exponential accuracy in a subinterval from a Gegenbauer partial sum of a piecewise analytic function // Math. Сотр. - 1995. - Т. 64, № 211. - С. 1081-1095.

81. Gottlieb D., Shu C-W. On the Gibbs phenomenon V: Recovering exponential accuracy from collocation point values of a piecewise analytic function // Numer. Math. — 1995.

- T. 71, № 4. - C. 511-526.

82. Gottlieb D., Shu C-W. On the Gibbs phenomenon III: Recovering exponential accuracy in a subinterval from a spectral partial sum of a piecewise analytic function // SIAM J. Num. Anal. - 1996. - T. 33, № 1. - C. 280-290.

83. Gottlieb D., Shu C-W. On the Gibbs' phenomenon and its resolution // SIAM Rev. — 1997. - T. 39, № 4. - C. 644-668.

84. Gottlieb D., Anne G. The Resolution of the Gibbs Phenomenon for "Spliced" Functions in One or Two Dimensions // Center for Research on Parallel Computation. — 1997.

85. Голованов P.В., Калиткин H.H. Продолжения повышенной гладкости для фурье-аппроксимации непериодической функции // Доклады Академии наук. — 2012. — 9. - Т. 446, № 1. - С. 25-29

86. Голованов Р.В., Калиткин Н.Н. Улучшение сходимости для аппроксимации непериодических функций рядами Фурье // Матем. моделирование. — 2014. — Т. 26, № 2.

- С. 108-118.

87. Калиткин Н.Н., Луцкий К.И. Метод нечётного продолжения для фурье-аппроксимации непериодических функций // Доклады Академии наук. — 2011.

- Т. 441, № 1. - С. 19-23.

88. Голованов Р.В., Калиткин Н.Н., Луцкий К.И. Нечётное продолжение для фурье-аппроксимации непериодических функций // Матем. моделирование. — 2013. — Т. 25, № 5. - С. 67-84.

89. Садовничий В.А. Теория операторов. — Моск. ун-та, 1986. — С. 368.

90. Добровольский Н.М., Рощеня А.Л. О числе точек в гиперболическом кресте // Математические заметки. — 1998. — Т. 63, № 3. — С. 363-369.

91. Fenn М., Kunis S., Potts D. Fast evaluation of trigonometric polynomials from hyperbolic crosses // Numer. Algorithms. - 2006. - T. 41, № 4. - C. 339-352.

92. Adcock B. Modified Fourier expansions: theory, construction and application. Ph.D. thesis. — Trinity Hall University of Cambridge. — 2010.

93. Калиткин H.H., Кузьмина Л.В., Юхно Л.Ф. Количественный критерий обусловленности систем линейных алгебраических уравнений // Математическое моделирование.

- 1995. - Т. 7, № 4. - С 99-127.

94. Golovanov R.V., Kalitkin N.N., Lutskiy K.I. Odd Extension for Fourier Approximation of Nonperiodic Functions // Mathematical Models and Computer Simulations. — 2013.

- T. 5, № 6. - C. 595-606.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.