Алгоритмы и программные средства для вейвлет-сжатия и оценки качества изображений тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Сидоров, Дмитрий Владимирович

  • Сидоров, Дмитрий Владимирович
  • кандидат технических науккандидат технических наук
  • 2011, Томск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 148
Сидоров, Дмитрий Владимирович. Алгоритмы и программные средства для вейвлет-сжатия и оценки качества изображений: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Томск. 2011. 148 с.

Оглавление диссертации кандидат технических наук Сидоров, Дмитрий Владимирович

ВВЕДЕНИЕ .7.

ГЛАВА 1. ПРОБЛЕМА СЖАТИЯ И ОЦЕНКИ КАЧЕСТВА СТАТИЧЕСКИХ ИЗОБРАЖЕНИЙ.

1.1. Анализ алгоритмов сжатия статических изображений.

1.1.1. Алгоритм сжатия JPEG.

1.1.2. Фрактальный алгоритм сжатия.

1.1.3. Сжатие с использованием нейронных сетей.

1.1.4. Алгоритм сжатия JPEG2000.

1.1.5. Результаты анализа алгоритмов сжатия.

1.2. Анализ методов и алгоритмов оценки качества статических изображений.

1.2.1. Субъективные (экспертные) методы оценки.

1.2.2. Объективные (математические) методы оценки.

1.2.3. Результаты анализа методов и алгоритмов оценки качества изображений.

1.3. Цель и задачи исследования.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Алгоритмы и программные средства для вейвлет-сжатия и оценки качества изображений»

Последние два десятилетия характеризуются резким ростом числа использований цифровых видеотехнологий в промышленности: цифровые охранные системы видеонаблюдения за режимными промышленными объектами; видеосистемы мониторинга и удаленного управления процессами добычи угля и каменной соли в добывающей промышленности; системы хранения и передачи космических снимков для нужд нефтегазовой отрасли и т.д. Однако передача и хранение видеоинформации (статических изображений и видеорядов) до сих пор остается наиболее ресурсопотребляемой частью таких цифровых систем. На практике это приводит к достаточно жестким требованиям, например, на ширину канала передачи и, как следствие, на стоимость его аренды; вычислительную мощность и энергопотребление аппаратуры, что актуально для встраиваемых систем на взрывоопасных производствах; размер хранилища видеоданных, например для систем видеонаблюдения и т.д. Следует оговорить, что в промышленности наиболее распространен фотореалистичный класс изображений [15,64] (далее будет рассматриваться только этот класс изображений). К этому классу относятся цветные и полутоновые изображения с большой палитр ой цветов и полутонов (обычно не менее 256) и плавным изменением яркости, например, снимки людей с видеокамер, сканированные фотографии, пейзажи, космические снимки поверхности земли и т.п. [10].

Одной из важных задач хранения, передачи и обработки видеоинформации является задача сжатия статических изображений. Эта задача решается многими исследователями уже более 20 лет (Д. Ватолин, А. Ратушняк, G.K. Wallace, W.B. Pennebaker и др.),и, несмотря на относительно хорошие результаты (алгоритмы JPEG и JPEG2000), до сих пор остается актуальной (далее будут рассматриваться только статические изображения). Актуальность задачи подтверждается и недавними разработками, например, в 2009 в университете города Линкольна штата Небраска-(США) была защищена кандидатская диссертация (Ph. D.) на тему «Сжатие изображений и видео с адаптивным контролем затрат» [94]. Заказчиком научно-исследовательской работы являлось национальное управление США по аэронавтике и исследованию космического пространства (NASA). Сфера применения разработки — сжатие изображений астрономических объектов (планет, спутников, астероидов и т.д.), полученных с борта космического аппарата.

Существующие алгоритмы сжатия изображений можно разделить на два класса [10]:

• сжатие без потерь;

• сжатие с потерями.

Класс алгоритмов сжатия изображений без потерь редко используется для сжатия фотореалистичных изображений, например полученных с аналоговой видеокамеры системы охраны режимного объекта, т.к. обеспечивает невысокий коэффициент сжатия, обычно не более 5. Стоит заметить, что при решении практически важных задач в промышленности наиболее распространены цветные (с глубиной цвета 24 бит на пиксель) и полутоновые (глубина градации яркости 8 бит на пиксель) изображения [15,64]. В основном такие ограничения вызваны характеристиками применяемой видеоаппаратуры, например, подавляющее большинство цифровых видео и фотокамер предоставляют видеоинформацию в этих форматах.

Наиболее распространены алгоритмы сжатия изображений с потерями, в основу которых положено предположение о том, что в исходном изображении содержится информация, которая слабо воспринимается зрительной системой человека (ЗСЧ). При сжатии эта часть информации безвозвратно теряется, что позволяет значительно увеличить коэффициент сжатия изображений при «неизменном», с точки зрения человека, качестве. Степень потерь данной информации или коэффициент сжатия будет определять качество распакованного изображения. Очевидно, что к алгоритмам сжатия, например, для охранных систем видеонаблюдения режимных объектов будут предъявляться высокие требования к коэффициенту сжатия (необходимо хранить видеозаписи в ; течение длительного времени, например, не менее года), к качеству распакованных изображений (оператору или охраннику должна быть предоставлена возможность распознавать лица людей, номера автомашин и т.п.) и к скорости сжатия/распаковки изображений (необходимо наблюдать процесс доступа на объект в режиме реального времени, например, обеспечивать 1-3 видеокадра в секунду).

На основании анализа результатов отечественных и зарубежных исследований и прикладных проектов по сжатию изображений можно сформулировать основные требования (критерии оценки эффективности) к алгоритмам сжатия изображений * с потерями, применяемым в промышленности [10,15,51,64]:

1. малое время сжатия и распаковки (от 40 мс);

2: высокий коэффициент сжатия (до 150);

3. высокое качество восстановленного (распакованного) изображения (пиковое отношение сигнал/шум от 24-26 дБ и более, в зависимости от решаемой прикладной задачи).

На современном этапе развития алгоритмов сжатия изображений алгоритм сжатия JPEG2000, пришедший на смену JPEG и основанный на вейвлетах, считается лучшим по второму и третьему критериям и принимается многими авторами собственных алгоритмов сжатия за эталон [9-11,49,82,97,100]. Однако удовлетворить первому критерию полностью не удается, т.к. этот алгоритм сложен в реализации и достаточно требователен к вычислительным ресурсам [42]. Поэтому задача разработки нересурсоёмких алгоритмов сжатия изображений, используемых в промышленности, до сих пор актуальна

Отметим, что не все указанные критерии оценки эффективности алгоритмов сжатия легко поддаются численному измерению. Так измерение скорости и коэффициента сжатия является простой задачей; а оценка качества восстановленных изображений во многом зависит от человеческого фактора (мнения экспертов), что делает, актуальным вопрос об оценке качества восстановленных изображений без участия человека [7-9,97].

Существует два класса методов оценки качества изображений:

• субъективный (экспертный);

• объективный (математический).

Известно, что самые надежные оценки качества изображения обеспечивают субъективные методы, но их применение на практике требует большого количества подготовленных людей и времени. Эффективным решением данной проблемы является применение объективных методов или "математических оценок [7,8,97].

Исторически объективные методы оценки качества изображений основывались на простых математических выражениях, таких как среднеквадратичная ошибка или дисперсия (СКО, англ. название МБЕ) и пиковое отношение сигнал/шум (ПОСШ, англ. название Р8КЕ1) [7,10,97]. Это объясняется сравнительно малой изученностью вопроса о работе зрительной системы человека (ЗСЧ). Также широкая распространенность данных алгоритмов объясняется простотой их программной реализации и высокой скоростью вычисления. Относительно недавно были предложены более сложные в вычислительном плане алгоритмы — индекс структурного сходства (англ. название ББГМ) и вейвлет-индекс структурного сходства (англ. название С\¥-881М), которые в ряде приложений показывают хорошую согласованность с экспертными оценками (значительно превосходят алгоритмы на основе СКО [96-98]) и обладают потенциалом для модернизации, цель которой — повышение достоверности результатов оценки [43-45,89,97]. Термин достоверность здесь и далее, применительно к результатам математической оценки качества изображений, означает, что алгоритм должен давать оценку максимально близкую к той, которая была получена в ходе экспертного метода. Поэтому задача разработки новых и -улучшения существующих, например SSIM и CW-SSIM, алгоритмов оценки качества изображений до сих пор актуальна.

Цель работы и задачи исследования. Целью диссертационного исследования является разработка алгоритмов и программных средств, предназначенных для вейвлет-сжатия и оценки качества восстановленных фотореалистичных статических изображений в промышленности.

Для достижения поставленной цели необходимо последовательное решение следующих задач.

1. Разработка алгоритмов математической оценки качества восстановленных изображений. Решение этой задачи предполагает также исследование эффективности предлагаемых алгоритмов.

2. -Разработка алгоритмов вейвлет-сжатия изображений. Решение данной задачи предполагает также исследование эффективности предлагаемых алгоритмов.

3. Создание для разработанных алгоритмов программных средств для вейвлет-сжатия и оценки качества восстановленных изображений, используемых в промышленности.

4. Апробация разработанных алгоритмов и программных средств при решении прикладных задач в промышленности.

Кратко изложим основное содержание работы.

Первая глава посвящена анализу существующих алгоритмов сжатия цветных и полутоновых фотореалистичных статических изображений и оценке их качества.

В первой части главы приведена классификация основных (наиболее распространенных) алгоритмов сжатия цветных и полутоновых изображений. Рассмотрены их основные преимущества и недостатки [9,11,18-20,3133,35,41,48,49,51,84,85,87,89]. Приведены основные требования (критерии оценки эффективности) к алгоритмам сжатия изображений с потерями, используемым в промышленности (рассмотрены выше). Кроме рассмотренных требований в промышленности к таким алгоритмам часто предъявляется дополнительное требование — простота программно-аппаратной реализации на недорогих современных программно-аппаратных вычислительных средствах.

Согласно работам [9,10,51,57] на данный момент по второму и третьему критериям (значительный коэффициент сжатия и высокое качество восстановленных изображений) лучшим алгоритмом сжатия изображений признан алгоритм 1РЕ02000, основанный на вейвлетах [10,13,14,41,49,51,82,89,100]. Однако этот алгоритм не удовлетворяет первому (малое время сжатия/распаковки) и дополнительному критериям, т.к. он сложен в реализации и достаточно требователен к вычислительным ресурсам. [49,89]. Поэтому задача модификации алгоритма сжатия 1РЕ02000 и разработки аналогичных простых алгоритмов, в том числе'пригодных для программно-аппаратной реализации на недорогих современных вычислительных средствах, продолжают оставаться актуальными.

Во втором разделе главы рассмотрена проблема получения достоверных оценок качества изображений, т.к. она играет одну из ключевых ролей при исследовании алгоритмов сжатия изображений. Приведена классификация методов оценки качества изображений и рассмотрены наиболее распространенные алгоритмы получения таких оценок. Согласно [7,8,89,90,94-98] самыми надежными методами оценки качества изображения считаются субъективные методы (экспертные оценки), но их применение требует большого количества людей и значительного количества времени, и, как правило, поэтому они малопригодны для использования в реальных ситуациях. Эффективным решением уменьшения трудоемкости и времени проведения экспертизы является применение объективных методов или математических оценок, дающих максимально приближенные к экспертному подходу результаты оценки качества изображений [9,97].

Согласно работам [96,97] выявлено, что оценки, основанные на простых математических выражениях, таких как СКО или дисперсия (англ. название М8Е) и ПОСШ (англ. название Р8ЫЯ), обладают малой достоверностью. Широкая распространенность данных алгоритмов объясняется простотой их программной реализации и высокой скоростью вычисления [7,97]. Показано, что более сложные в вычислительном плане алгоритмы индекс структурного сходства (англ. название 881М) и вейвлет-индекс структурного сходства (англ. название С\\^-881М) в ряде приложений показывают хорошую согласованность с экспертными оценками (значительно превосходят алгоритмы на основе СКО [96-98]) и обладают значительным потенциалом для модернизации, цель которой — повышение достоверности результатов оценки [43-45,89,97]. Поэтому задача разработки новых и улучшения существующих, например 881М и С\М-881М, алгоритмов оценки качества изображений до сих пор актуальна.

На основании приведенного анализа сформулированы цель и задачи диссертационного исследования.

Во второй главе рассмотрены алгоритмы оценки качества восстановленных изображений, положенные в основу программного комплекса. Подробно описаны и рассмотрены алгоритмы 881М и С\У-881М [39,43-45,97,98], дающие наиболее приближенные к экспертной оценке результаты. Выявлены основные недостатки указанных алгоритмов и предложены пути их преодоления. Поставлено два численных эксперимента, для проведения которых были разработаны специализированные программные средства (программы). Первый численный эксперимент нацелен на подбор значений коэффициентов (параметров) комплексного дискретного ориентированного вейвлет-преобразования (количества шагов и ориентированных высокочастотных диапазонов) в алгоритме С\¥-881М с тем, чтобы повысить достоверность получаемых оценок качества изображений и скорость их вычисления. На основании полученных результатов предложены два модифицированных алгоритма оценки качества восстановленных изображений AWS и FAWS. Цель второго эксперимента — поиск -значений весовых коэффициентов (показателей степеней составляющих оценки для окна: яркости, контраста и структуры) алгоритма SSIM, также повышающих достоверность оценок качества изображений и скорость их вычисления. На основании полученных результатов предложены два модифицированных алгоритма оценки качества изображений MSSIM и FMSSIM.

Предложенные алгоритмы AWS, FAWS, MSSIM и FMSSIM были исследованы на время вычисления оценки на двух изображениях из набора Calgary Corpus [67]. На основании результатов исследования предложенных алгоритмов можно сделать следующие выводы:

1. алгоритм MSSIM значимо не уступает в скорости вычисления своей исходной реализации (алгоритму SSIM);

2. алгоритмы AWS, FAWS и FMSSIM значительно превосходят в -скорости вычисления (относительное время сократилось не менее чем на 44%) свои соответствующие исходные реализации.

Проведено исследование с целью сравнения достоверности полученных оценок предложенных алгоритмов AWS, FAWS, MSSIM, FMSSIM и наиболее распространенных аналогов на наборе эталонном изображений TID2008 [36]. Согласно результатам исследования все предложенные алгоритмы обеспечивают более достоверную оценку качества изображений (не менее чем на 10% относительно аналогов), нежели их классические аналоги SSIM, CW-SSIM и наиболее распространенные алгоритмы PSNR и MSE.

Третья, глава посвящена разработке алгоритмов вейвлет-сжатия изображений, пригодных для применения в промышленности.

В первом разделе главы рассмотрен процесс разработки алгоритма QWC посредством упрощения и исключения определенных этапов обработки изображения из алгоритма JPEG2000* [10,49,78,82], но с учётом предъявленных ранее требований (критериев оценки эффективности), предъявляемых-промышленностью.

В ходе разработки алгоритма С>\¥С предложена оригинальная схема квантования и упаковки вейвлет-коэффициентов, существенно упрощающая и ускоряющая выполнение аналогичного этапа квантования в алгоритме ХРЕС2000 [48]. В основу схемы свертки вейвлет-коэффициентов положено предположение, что эти коэффициенты на более высоких уровнях разложения обладают большей энергией, чем на нижних, следовательно, должны квантоваться менее грубо. Так как к разрабатываемому алгоритму предъявляется требование простоты реализации и, соответственно, высокой скорости работы, то коэффициенты квантования для каждого уровня вычисляются из коэффициента квантования нижестоящего уровня согласно формуле: а где / - уровень вейвлет-преобразования (начиная со второго уровня), Ь — константа (поправочный коэффициент, найденный в ходе численного эксперимента), — начальный коэффициент квантования (также найденный в ходе численного эксперимента).

В алгоритме сжатия так же, как и в алгоритме 1РЕ02000, главным параметром при сжатии изображения, который указывает пользователь, является коэффициент сжатия Кс (размер сжатого файла). Но коэффициент сжатия Кс не единственный параметр, участвующий в сжатии, начальный коэффициент квантования и поправочный коэффициент Ь также должны быть заданы. Так как пользователю удобно задавать только коэффициент сжатия Кс, то следует определить зависимость коэффициента квантования 0,\ и поправочного коэффициента Ь от коэффициента сжатия Кс. Поиск коэффициентов <2\ т Ь для каждого конкретного сжимаемого изображения является достаточно длительным процессСм. Поэтому для облегчения этого процесса значения коэффициентов квантователя и I в зависимости от значений Кс были предварительно получены в ходе компьютерного численного эксперимента. Для проведения эксперимента по поиску этих коэффициентов, который проводился на СКК «СКИФ-политех»,- была разработана специальная программа.

Разработанный алгоритм QWC вейвлет-сжатия цветных и полутоновых статических изображений был исследован на эталонном наборе изображений Calgary Corpus [67]. Результаты исследования показали, что разработанный алгоритм отличается от JPEG2000 большим быстродействием, при сопоставимом качестве восстановленного изображения (коэффициент сжатия одинаков).

Во второй части главы рассмотрена предложенная модификация алгоритма QWC - алгоритм BF-QWC, предназначенная для реализации на цифровом сигнальном процессоре (ЦСП) ADSP-BF533 фирмы Analog Devices и отличающаяся модифицированным квазииррациональным вейвлет-• преобразованием, сокращенной схемой сжатия и адаптированным под источник сигнала квантователем.

Схема алгоритма BF-QWC соответствует схеме алгоритма QWC за исключением следующего:

Г. отсутствует этап предварительной обработки;

2. используется квазииррациональное дискретное вейвлет-преобразование с целью повышения скорости преобразования на ЦСП;

3. используются адаптированные под; источник сигнала (аналоговая, видеокамера стандарта PAL) коэффициенты квантователя;

Разработанный алгоритм BF-QWC был программно реализован на ЦСП ADSP-BF533, а его эффективность исследована с использованием отладочной платы ADSP-BF533 EZ-KIT Lite. Результаты проведенного исследования показали, что модифицированный для ЦСП ADSP-BF533 алгоритм BF-QWC не уступает исходному алгоритму QWC по качеству восстановленных цветных и полутоновых изображений (при неизменном коэффициенте сжатия). Исследования: алгоритма на скорость сжатия/распаковки изображений подтвердили, что алгоритм BF-QWC, реализованный для ЦСП АЕ)8Р-ВР533, полностью удовлетворяет требованиям, которые предъявляются к аппаратно-ориентированным -алгоритмам сжатия изображений в промышленности.

В четвертой главе рассмотрены созданные программные средства для вейвлет-сжатия и оценки качества изображений и результаты их апробации при решении практически важных задач в промышленности. Приведены требования к разработанным программным средствам (с учетом их применения в промышленности). Показана структура программного комплекса для вейвлет-сжатия и оценки качества восстановленных изображений. Описан выбор базовых средств разработки, использованных при создании комплекса. Указываются особенности программной реализации, дается описание разработанных оригинальных программных средств и особенностей созданных интерфейсов пользователя. Показано, что разработанный комплекс программ был использован для решения следующих практически важных задач в промышленности:

1. обеспечение видеоидентификации работников в системе контроля доступа на режимные объекты предприятий пищевой промышленности;

2. обеспечение видеонаблюдения для электронных систем удаленного мониторинга и управления угле- и соледобывающими комбайнами.

Проведена апробация и внедрение разработанных алгоритмов и программных средств при решении практически важных задач в угольной и пищевой отраслях промышленности. Результаты решения этих задач подчеркивают практическую значимость работы и подтверждают эффективность созданных алгоритмов и программ для сжатия и оценки качества изображений. Осуществлено внедрение разработанных алгоритмов и программных средств в учебный процесс.

Апробация работы. Основные результаты работы докладывались и обсуждались на следующих конференциях: IV, V, VI и IX Всероссийских научно-практических конференциях студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии» г. Томск, 2006, 2007, 2008, 2011 гг.); XIII и XIV Международных научно-практических конференциях студентов и молодых ученых «Современная техника и технологии» (г. Томск, 2007,2008 гг.); XII Международной научно-технической конференции и выставке «Цифровая обработка сигналов и ее применение» (г. Москва, 2009 г.), VII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Технологии Microsoft в теории и практике программирования» (г. Томск, 2010 г.).

Результаты диссертационной работы оценивались на конкурсах и получили следующие награды: диплом I степени на IV и V Всероссийских научно-практических конференциях студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии» (г. Томск, 2006, 2007 гг.); диплом II степени на XIV Международной научно-практической - конференции студентов и молодых ученых- «Современные техника и технологии» (г. Томск, 2008 г.).

Работа была поддержана грантом программы «Участник Молодежного Научно-Инновационного Конкурса» («У.М.Н.И.К.») Фонда содействия развитию малых форм предприятий в научно-технической сфере (проект выполнялся в период 2007-2010 гг.).

По результатам диссертационных исследований опубликовано 10 работ, в том числе 3 статьи в рецензируемых изданиях, рекомендованных ВАК.

Научную новизну полученных в работе результатов определяют.

1. Алгоритм QWC вейвлет-сжатия фотореалистичных изображений, отличающийся от алгоритма JPEG2000 большим быстродействием при сопоставимом качестве восстановленного изображения (коэффициент сжатия одинаков).

2. Алгоритм BF-QWC вейвлет-сжатия фотореалистичных изображений, разработанный для цифрового сигнального процессора ADSP-BF533 фирмы Analog Devices, отличающийся от алгоритма QWC модифицированным квазииррациональным вейвлет-преобразованием, сокращенной схемой -сжатия и адаптированным под источник сигнала квантователем.

3. Модифицированные алгоритмы AWS и FAWS для математической оценки качества восстановленных фотореалистичных изображений, отличающиеся от классического алгоритма CW-SSIM большей достоверностью, а в случае алгоритма FAWS - ещё и большей скоростью вычисления оценки качества.

4. Модифицированные алгоритмы MSSIM и FMSSIM для математической оценки качества восстановленных фотореалистичных изображений, отличающиеся от классического алгоритма SSIM большей достоверностью, а в случае алгоритма FMSSIM - ещё и большей скоростью вычисления оценки качества.

Практическая ценность и реализация результатов работы.

Практически значимыми являются созданные алгоритмы и программные средства, организованные в виде комплекса программ. Программный комплекс предназначен для вейвлет-сжатия и оценки качества восстановленных фотореалистичных изображений и пригоден для решения практически важных задач в промышленности. Программы написаны на языках Си и ЦСП ADSP-BF533 с использованием сред разработки Microsoft Visual Studio 2008, Embarcadero RAD Studio 2010, VusualDSP++ 5.0 и Anjuta для IBM РС-совместимых компьютеров, суперкомпьютерного кластера (СКК) «СКИФ-политех» и ЦСП ADSP-BF533. Объём исходного кода программ 6700 строк. На программное средство оценки качества изображений получено свидетельство о государственной регистрации программы для ЭВМ №2011612637 от 31.03.2011.

Разработанный комплекс программ был использован для решения ряда следующих практически важных задач в промышленности.

1. Обеспечение видеоидентификации в системе контроля доступа (СКД) на режимные объекты предприятий пищевой промышленности. Разработанный программный модуль для СКД обеспечивает оперативный контроль в режиме верификации доступа работника на режимный объект (объекты), т.е. позволяет охраннику производить визуальное сравнение предъявителя пропуска, его фотографии из базы данных отдела кадров и снимка с видеокамеры, который после сжатия сохраняется в базу снимков истории доступа на объект. На основании полученных данных охранник принимает решение о допуске работника на режимный объект.

2. Обеспечение видеонаблюдения для электронных систем удаленного мониторинга и управления угле- и соледобывающими комбайнами. Разработанный программный модуль видеоподсистемы позволяет получать и передавать по узкополосным цифровым каналам сжатые полутоновые изображения рабочего органа комбайна от цифровой камеры наблюдения к пульту управления, который отображает полученные изображения комбайнеру (оператору). На основании полученных видеоданных комбайнер удаленно следит за процессом добычи угля (соли).

Разработанные алгоритмы и программные средства для вейвлет-сжатия и оценки качества изображений были внедрены в ОАО «Томское пиво» и ООО «НПФ «Автоматика». Результаты внедрения подтвердили их эффективность при решении практически важных задач в пищевой и угольной отраслях промышленности.

Алгоритмы BF-QWC, AWS, MS SIM и их программные реализации используются в учебном процессе Института кибернетики Национального исследовательского Томского политехнического университета.

Результаты внедрения подтверждены соответствующими актами.

Основные положения, выносимые на защиту.

1. Алгоритм QWC позволяет осуществлять сжатие/распаковку фотореалистичных изображений быстрее алгоритма JPEG2000 при сопоставимом качестве восстановленного изображения и одинаковом коэффициенте сжатия.

2. Алгоритм вейвлет-сжатия фотореалистичных изображений BF-QWC для недорогого и малопроизводительного цифрового сигнального процессора

ADSP-BF533 фирмы Analog Devices обеспечивает сопоставимые с алгоритмом QWC время сжатия/распаковки, коэффициент сжатия и качество восстановленных изображений.

3. Модифицированные алгоритмы AWS и FAWS позволяют производить математическую оценку качества восстановленных фотореалистичных изображений с большей достоверностью, чем классический алгоритм CW-SSIM, а в случае алгоритма FAWS — ещё и с большей скоростью.

4. Модифицированные алгоритмы MSSIM и FMSSIM позволяют производить математическую оценку качества восстановленных фотореалистичных изображений с большей достоверностью, чем классический алгоритм SSIM, а в случае алгоритма FMSSIM — ещё и с большей скоростью.

Личный вклад.

1. Постановка задач диссертационного исследования выполнена автором совместно с Н.Г. Марковым.

2. Разработка алгоритмов сжатия QWC и BF-QWC выполнена совместно с А.Н. Осокиным.

3. Разработка алгоритмов оценки качества восстановленных фотореалистичных статических изображений MSSIM, FMSSIM, AWS, FAWS и программных средств QWC, BF-QWC, ADSP-Reader, IMQ, QWC-A, BFQWC-A проведена автором.

4. Численные эксперименты по исследованию эффективности предложенных алгоритмов вейвлет-сжатия и оценки качества изображений проведены автором.

5. Разработка программного модуля видеоидентификации для системы контроля доступа на режимные объекты предприятий пищевой промышленности проведена автором. Внедрение модуля осуществлено в ОАО «Томское пиво» совместно с сотрудниками предприятия Бойко Е.Н и Насоновым A.C.

6. Разработка программного модуля видеоподсистемы в составе электронной системы мониторинга и удаленного управления угле-- и соледобывающими комбайнами проведена автором. Внедрение программного модуля в опытный образец системы мониторинга и удаленного управления угольными комбайном КП21ДР осуществлено в ООО «НПФ «Автоматика» совместно с сотрудниками предприятия Барановым А.Ю. и Ануфриевым A.C.

Автор выражает глубокую благодарность научному руководителю доктору технических наук, профессору Н.Г. Маркову за помощь в написании работы, ценные советы и замечания. Автор выражает особую благодарность за всестороннюю помощь и поддержку доценту кафедры вычислительной техники Института кибернетики Национального исследовательского Томского политехнического университета кандидату технических наук А.Н. Осокину.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Сидоров, Дмитрий Владимирович

4.5. Основные результаты и выводы по главе

1.-В соответствии с предъявленными требованиями (пп. 4.2) предложена обобщенная структура программного комплекса для вейвлет-сжатия и оценки качества восстановленных изображений, пригодного для решения практически важных задач в промышленности.

2. Согласно предъявленным требованиям создан программный комплекс для вейвлет-сжатия и оценки качества восстановленных изображений, который пригоден для решения практически важных задач в промышленности. Программы написаны на языках Си и ассемблер ЦСП ADSP-BF533 с использованием сред разработки Microsoft Visual Studio 2008, Embarcadero RAD Studio 2010, VusualDSP++ 5.0 и Anjuta для IBM PC-совместимых компьютеров, CKK «СКИФ-политех» и ЦСП ADSP-BF533. Объём исходного кода программ 6700 строк. На программное средство IMQ для оценки качества изображений получено свидетельство о государственной регистрации программы для ЭВМ1 №2011612637 от 31.03.2011.

3. Проведена апробация разработанных алгоритмов и программ комплекса при решении практически важных задач в угольной и пищевой отраслях промышленности. Результаты решения задач подчеркивают практическую значимость работы и подтверждают эффективность разработанных алгоритмов и программ.

4. Осуществлены внедрения разработанных алгоритмов и программных средств в ООО «НПФ «Автоматика», ОАО «Томское пиво» и в учебный процесс Института кибернетики Национального исследовательского Томского политехнического университета, о чем получены соответствующие акты.

ЗАКЛЮЧЕНИЕ

Диссертационная работа посвящена созданию алгоритмов и программных средств для вейвлет-сжатия и оценки качества восстановленных фотореалистичных статических изображений в промышленности.

Получены следующие основные научные и практические результаты.

1. Сформулированы основные требования, предъявляемые в промышленности к разрабатываемым алгоритмам сжатия изображений. На основании этих требований проведен анализ основных наиболее распространенных алгоритмов сжатия изображений с потерями. По результатам анализа выбран наиболее перспективный для последующих исследований и разработок класс алгоритмов сжатия на основе вейвлетов.

2. Проведен анализ методов и алгоритмов оценки качества изображений. Согласно результатам анализа для дальнейших исследований выбран класс эталонных алгоритмов математической (объективной) оценки качества восстановленных изображений, который широко используется при проведении исследований алгоритмов сжатия изображений с потерями.

3. Разработан алгоритм QWC вейвлет-сжатия цветных и полутоновых изображений. Результаты исследований показали, что он позволяет сжимать изображения с большей скоростью, чем алгоритм JPEG2000 при сопоставимом качестве восстановленного изображения (коэффициент сжатия одинаков).

4. Разработан алгоритм BF-QWC вейвлет-сжатия цветных и полутоновых изображений для недорогого и малопроизводительного ЦСП ADSP-BF533 фирмы Analog Devices. Результаты проведенного исследования показали, что он не уступает алгоритму QWC по качеству восстановленных изображений при неизменном коэффициенте сжатия, а также полностью удовлетворяет требованиям, которые предъявляются промышленностью к программно-аппаратным средствам сжатия изображений.

5. Предложены модифицированные алгоритмы математической оценки качества восстановленных изображений AWS и FAWS. Результаты проведенных численных экспериментов показали, что предложенные модификации обладают большей скоростью получения оценок качества изображений, чем исходный алгоритм CW-SSIM.

6. Предложены модифицированные алгоритмы математической оценки качества восстановленных изображений MS SIM и FMSSIM. Результаты проведенных численных экспериментов показали, что предложенный модифицированный алгоритм MS SIM не уступает в скорости вычисления оценок качества изображений исходному алгоритму SSIM, а алгоритм FMSSIM значительно его превосходит.

7. Проведено исследование предложенных и наиболее распространенных алгоритмов оценки качества восстановленных изображений на достоверность получаемых оценок. Результаты исследования показали, что предложенные алгоритмы MSSIM/FMSSIM и AWS/FAWS эффективнее наиболее распространенных алгоритмов SSIM, CW-SSIM, PSNR (ПОСШ) и MSE (СКО).

8. Предложена структура программного комплекса для вейвлет-сжатия и оценки качества восстановленных изображений, пригодного для решения практически важных задач сжатия изображений в промышленности. Созданы программные средства и библиотеки функций на языке Си и ассемблер ЦСП ADSP-BF533, реализующие предложенные алгоритмы. Объём исходного кода программного комплекса 6700 строк.

9. Проведена апробация разработанных алгоритмов и программных средств при решении практически важных задач в угольной и пищевой отраслях промышленности. Результаты решения этих задач подчеркивают практическую значимость диссертационной работы и подтверждают эффективность созданных алгоритмов и программ для сжатия и оценки -качества фотореалистичных изображений.

10. Осуществлено внедрение разработанных алгоритмов и программных средств в ООО «НПФ «Автоматика», ОАО «Томское пиво» и в учебный процесс Института кибернетики Национального исследовательского Томского политехнического университета, о чём свидетельствуют полученные акты о внедрении.

Список литературы диссертационного исследования кандидат технических наук Сидоров, Дмитрий Владимирович, 2011 год

1. Ахмед Н., Pao K.P. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980. -248 с.

2. Бланшет Ж., Саммерфилд М. Qt 4: программирование GUI на С++. Пер. с англ. 2-е изд., доп. -М.: КУДИЦ-ПРЕСС, 2008. 736 с.

3. Блатгер К. Вейвлет-анализ. Основы теории: учебное пособие: пер. с нем. -М.: Техносфера, 2004. 273 с.

4. Буркатовская IQ-Б., Карагодин М.А., Осокин А.Н. Двумерные дискретные преобразования в алгоритмах сжатия видеопоследовательностей // Известия Томского политехнического университета. 2006. — Т. 309. — №2. -С. 17-22.i

5. Вальпа О. Разработка устройств на основе цифровых сигнальных процессоров фирмы Analog Devices с использованием VisualDSP++. — М.: Телеком, 2007. 270 с.

6. Ватолин Д. Description of methods of subjective video quality evaluation. URL: http://compression.ru/video/qualitymeasure/subjectivemetrics infoen.html (дата обращения: 10.10.2007).

7. Ватолин Д., Москвин А. Программный продукт MSU Video Quality Measurement Tool версия 1.4. URL: http://compression.ru/video/quality measure/videomeasurementtool.html (дата обращения: 08.01.2008).

8. Ватолин Д., Москвин А., Петров О. Сравнение кодеков изображений стандарта JPEG2000 и Windows Media Photo (новое название: Microsoft HD photo). URL: http://compression.ru/video/codeccomparison/wmp codecscomparison.html (дата обращения: 20.06.2007).

9. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений-и видео. — М.: ДИАЛОГ-МИФИ, 2002. 384 с.

10. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. СПб.: ВУС, 1999. - 208 с.

11. Вудс Р., Гонсалес Р. Цифровая обработка сигналов. — М;: Техносфера, 2005. — 1075 с.

12. Добеши И. Десять лекций по вейвлетам. — Ижевск: НИЦ Регулярная и хаотическая динамика, 2001. — С. 394-401.

13. Демьяновски В. СС ТУ; Библия видеонаблюдения. Цифровые и сетевые технологии. Пер. с англ. — М.: «Ай-Эс-Эс-Пресс», 2006. — 480 с.

14. Ильясов Б.Г., Мунасыпов P.A., Булаев В.И. Минимизация структуры нейронной; сети для. решения задачи сжатия данных // Нейрокомпьютеры: разработка; применение. — 2007. — №10. С. 31-35.

15. Карагодин М.А., Осокин А.Н. Алгоритм сжатия' изображений на основе функций Уолша//Материалы междунар. научно-техн. конф. Информ. системы и технологии ИСТ'2003. — Новосибирск, 2003. — Т. 2. — С.126-130. .

16. Карагодин М.А., Осокин А.Н. Сжатие полноцветных изображений с использованием функций Уолша // Доклады 6-й Междунар; конф.

17. Цифровая обработка сигналов и ее применение. М., 2004. - Т. 2. - С. 143146.

18. Касперски К. Техника оптимизации программ. Эффективное использование памяти. СПб.: БХВ-Питербург, 2003 — С. 17-48.

19. Копейский машиностроительный завод Комбайн проходческий КП21. URL: http://www.kopemash.ru/site/index/katalog/index.php?storeid=14 (дата обращения: 12.06.2010).

20. Культин Н. С++ Builder в задачах и примерах. СПб.: БХВ-• Петербург, 2010. - 700 с.

21. Мастрюков Д. Алгоритмы сжатия информации. Часть 2. Арифметическое кодирование // Монитор. — 1994. — №1. — С. 20-23.

22. Мастрюков Д. Алгоритмы группы LZ // Монитор. — 1994. — №2. — С. 10-13.

23. Мастрюков Д. Алгоритм LZW // Монитор. 1994. - №3. — С. 8-11.

24. Мастрюков Д. Алгоритмы сжатия в драйверах // Монитор. — 1994. — №4. — С. 24-27.

25. Мастрюков Д. Сжатие по Хаффмену // Монитор. — 1993. — №7-8.

26. Мэтью Н., Стоуне Р. Основы программирования в Linux, 4-е изд. — СПб.: БХВ-Петербург, 2009. 906 с.

27. Осовский С. Нейронные сети для обработки информации, пер. с польск. М.: ФиС, 2004. - 344 с.а

28. Пауерс Л., Снелл М. Microsoft Visual Studio 2008. СПб.: БХВ-Петербург, 2009. - 896 с.

29. Поляков С.Н. Модификация алгоритма RLE для дожатия коэффициентов ДКП в алгориме JPEG // Молодежь и совр. информ. технологии: Сб. трудов III Всеросс. научно-практ. конф. студентов, аспирантов и молодых ученых. Томск, 2005. — С. 274-276.

30. Пономаренко Н. Tampere image database 2008 TID2008, Version 1.0. URL: http://www.ponomarenko.info/tid2008.htm (дата обращения: 08.08.2009).

31. Секунов Н. Программирование на С++ в Linux. — СПб.: БХВ-Петербург, 2004. 368 с.

32. Сидоров Д.В. К вопросу оценки качества восстановленных изображений // Прикладная информатика. М., 2008. - №4. - С. 1-4.

33. Сидоров Д.В. Модификация алгоритма SSIM // Прикладная информатика. М., 2010. -№ 4. - С. 55-57.

34. Сидоров Д.В. Оценка качества изображений. — Свидетельство об официальной регистрации программы для ЭВМ №2011612637 от 31.03.2011.

35. Сидоров Д.В. Осокин А.Н. QWC алгоритм вейвлет-сжатия изображений // Труды Российского научно-техн. общества радиотехники, электроники и связи имени A.C. Попова. Серия: Цифровая обработка сигналов и ее применение. М., 2009. - Вып. XI-2. - С. 396-399.

36. Сидоров Д.В. Осокин А.Н. Марков Н.Г. Оценка качества изображений с использованием вейвлетов // Известия Томского политехнического университета. — 2009 — Т.315. — № 5. — С. 104-107.

37. Сидоров Д.В. Программная реализация метода оценки качества изображений SSIM // Молодежь и совр. информ. технологии: Сб. трудов VI Всеросс. научно-практ. конф. студентов, аспирантов и молодых ученых. -Томск, 2008. С.* 151-152.

38. Сидоров Д.В. Тестирование метрик. URL: http://imq.vt.tpu.ru (дата обращения: 21.06.2009).

39. Сидоров Д.В., Осокин А.Н. Простой алгоритм вейвлет-сжатия полутоновых и цветных изображений // Известия Томского политехнического университета. — 2007 — Т. 311. — № 5. — С. 86-91.

40. Системы контроля доступа (СКД) PERCo. URL: http:// www.perco.ru/products/sistemy-kontrolja-dostupa/ (дата обращения: 21.12.2010).

41. Соломон Д. Сжатие данных, изображений и звука. — М.: Техносфера, 2004. С. 25-76, 111-284.

42. Страуструп Б. Введение в язык С++. М.: ДИАЛОГ-МИФИ, 2000. -386 с.

43. Умняшкин C.B. Алгоритм компрессии неподвижных изображений на основе дискретного вэйвлет-преобразования // VII междунар. конф. Математика. Компьютер. Образование: Тез. док. — Москва: Прогресс-Традиция, 2000. С. 327.

44. Умняшкин C.B. О модификации дискретного косинусного преобразования // Теория приближений и гармонический анализ: Тез. докл. междунар. конф. Тула, 1998. - С. 264-265.

45. Умняшкин C.B., Космач М.В. Оптимизация кодирования цифровых изображений по методу JPEG // Известия вузов. Электроника. — 2000.-№4-5.-С. 139-141.

46. Умняшкин C.B., Космач М.В. Оптимизация кодирования цифровых изображений по методу JPEG // Известия вузов. Электроника. — 2000.-№4-5.-С. 139-141.

47. Уэлстид С. Фракталы и вейвлеты для сжатия изображений. — М.: Триумф, 2003. С. 135-210.

48. Хортон A. Visual С++ 2008: базовый курс. Visual Studio 2008. M.: ООО И.Д. Вильяме, 2007. - 1280 с.

49. Шеннон К. Работы по теории информации и кибернетике. — М.: Изд-во иностранной литературы, 1963. — 830 с.

50. Яковлев А.Н. Основы вейвлет-преобразования сигналов: учебное пособие. М.: САЙНС-ПРЕСС, 2003. - 80 с.

51. Analog Devices Corporation EZ-KIT Lite for the ADSP-BF533, ADSP-BF532, and ADSP-BF531 Blackfin Processors. URL: http://www.analog.corn/en/embedded-processing-dsp/blackfin/BF533-EARDWA RE/processors/product.html (дата обращения: 12.06.2009).

52. Analog Devices Corporation High Performance General Purpose Blackfin Processor. URL: http://www.analog.com/en/embedded-processing-dsp /blackfin/adsp-bf533.html (дата обращения: 12.06.2009.)

53. Anthony С. Caputo Digital Video Surveillance and Security. — UK.: Butterworth-Heinemann, 2010. — 352 p.

54. Anjuta DevStudio: Integrated Development Environment. URL: http://projects.gnome.org/anjuta/ (дата обращения: 01.04.2008).

55. Bleivik К. С++ Builder 2009 Professional Getting started. URL: http://www.kjellbleivik.com/ (дата обращения: 22.03.2009).

56. Calgary Corpus тестовые наборы изображений. URL: http://www.links.uwaterloo.ca/bragzone.base.html (дата обращения 01.03.2007).

57. Chakrapani Y., Rajan К. Genetic algorithm applied to fractal image compression // ARPN Journal of Engineering and Applied Sciences. 2009. — Vol. 4.-No. l.-P. 53-58.

58. Chatterjee P., Milanfar P. Image denoising using locally learned dictionaries // Conf. 7246 on Computational Imaging. San Jose, USA, 2009.

59. Dinesh S. Image compression and feature extraction with neural network // Allied Academies International Conference. — Jacksonville, USA, 2007. -Vol. 11.-No. l.-P. 33-37.

60. Duraisamy R., Valarmathi L, Ayyappan J. Iteration free hybrid fractal wavelet image coder // International Journal of Computation. — 2008. — Vol. 6. -No. 4.-P. 34-40.

61. Feng X. DCT-based Video Quality Evaluation, research implementation for project EE392J. URL: http://www.hpl.hp.com/personal/ JohnApostolopoulos/StanfordEE392J/project.ps (дата обращения: 2.05.2009).

62. Firebird — The RDBMS that's going where you're going. URL: http://www.firebirdsql.org (дата обращения: 12.12.2010).

63. Hassaballah M., Макку M.M., Youssef B.M. A Fast Fractal Image Compression Method Based Entropy // Electronic Letters on Computer Vision and Image Analysis. 2005. - Vol. 5. - No. 1. - P. 30-40.

64. Hollingworth J., Swart В., Cashman M., Gustavson P. Borland С++ Builder 6.0 Developers"s guide. Que, USA, 2003. - 520 p.

65. International Telecommunication Union ITU-T BT.500-11, ITU-R WP6Q standards. URL: http://www.itu.int/net/home/index.aspx (дата обращения: 2.04.2009).

66. Jampour M., Yaghoobi M., Ashourzadeh M., Fractal images compressing by estimating the closest neighborhood with using of schema theory // Journal of Computer Science. -2010. Vol. 6. -No. 5. -P. 591-596.

67. JPEG committee. URL: http://www.jpeg.org (дата обращения: 2.02.2008).

68. Kominek J. Algorithm for Fast Fractal Image Compression. —Waterloo: University of Waterloo, Canada, 1995. 10 p.

69. KT&C KP-HD38CZ. URL: http://www.ktnc.co.kr/russian/view topic.php?p=433&highlight=HD38CZCM#433 (дата обращения: 12.06.2009).

70. Lifeng X., Liangbin Z. A Study of Fractal Image Compression Based on an Improved Genetic Algorithm // International Journal of Nonlinear Science. -2007.-Vol.3.-No. 2.-P. 116-124.

71. Maj L., Lars F. Villemoes Image compression with adaptive Haar-Walsh tilings // SPIE. -2000. P. 911-921.

72. Maj id Rabbani, Diego Santa Cruz The JPEG2000 Still-Image Compression Standard. — Lausanne: Swiss Federal Institute of Technology of Lausanne, 2002. 246 p.

73. Michael D. Adams Coding of Still Pictures JBIG, JPEG. Vancouver: Dept. of Electrical and Computer-Engineering University of British Columbia ВС Canada, 2003.-21 p.

74. Muruganandham A. Effective MSE optimization in fractal image compression // International Journal of Computer Science and Information Security.-2010.-Vol. 8.-No. 2.-P. 238-243.

75. MySQL. URL: http://www.mysql.com (дата обращения: 12.12.2010).

76. Pandian A. A neural network approach for color image compression in transform domain // International Journal of Recent Trends in Engineering. 2009. -Vol. 2.-No. 2.-P. 152-154.

77. Qt Creator IDE and tools Qt — A cross-platform application and UI framework. URL: http://qt.nokia.com/products/developer-tools/developer-tools (дата обращения: 12.12.2010).

78. Santa-Cruz D. and Ebrahimi T. An analystic study of JPEG2000 functionalities // International Conference on Image Processing (ICIP). — Vancouver, Canada, 2000.

79. Starck J.L., Donoho D.L., Candes E. J. Very High Quality Image Restoration by combining Wavelets and Curvlets. Pasadena: California Institute of Technology, USA, 2005.

80. Steerable Pyramid: a translation and rotation-invariant wavelet representation for images. — URL: http://www.cns.nyu.edu/~eero/STEERPYR/index.html (дата посещения: 21.02.2008).

81. Software written by Filip Rooms. URL: http ://www.filiprooms.be/research/software/index.html (дата посещения: 22.03.2008).

82. VisualDSP++ Development Software. URL: http://www.analog.com/en/embedded-processing-dsp/blackfln/vdsp.html (дата обращения: 10.06.2010).

83. Wang H. Robust image and video coding with adaptive rate control: ph. D. in Engineering Science. Lincoln, Nebraska, 2009. - 170 p.

84. Wang Z., Simoncelli E., Bovik A. Multi-scale structural similarity for image quality assessment // 37th IEEE Asilomar Conf. on Signals. -N.Y., 2003. -P. 44-50.

85. Wang Z. Image quality assessment: from error visibility to structural similarity // IEEE transactions on image processing. — 2004. — Vol. 3. P. 600612.

86. Wang Z., Bovik A.C. Modern image quality assessment. — N.Y.: Morgan & Claypool, 2006. 157 p.

87. Wang Z., Simoncelli E.P. Translation insensitive image similarity in complex wavelet domain // IEEE Inter. Conf. Acoustic, Speech and Signal Processing. Philadelphia, 2005. - Vol. 2. - P. 673-576.

88. Wickerhauser M.V. Lectures on wavelet packet algorithm. Missouri: Department of Mathematics, Washington University St. Louis, USA, 1991. — P. 65.

89. Zargari F. Reza Hashemi M.' An Improved Motion JPEG2000 Decoder for Error Concealment of Segmentation Symbol Faults. // Hindawi Publishing Corparation EURASIP, Journal on Advances in Signal Processing, 2008. 103 p.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.