Эффективные алгоритмы обработки и сжатия цифровых изображений и видеоданных на основе вейвлет-пакетного разложения тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат технических наук Косткин, Иван Вячеславович
- Специальность ВАК РФ05.12.04
- Количество страниц 183
Оглавление диссертации кандидат технических наук Косткин, Иван Вячеславович
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1 РАЗРАБОТКА И ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКОЙ МОДЕЛИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ВИЗУАЛЬНОГО ВОСПРИЯТИЯ
1.1 Вводные замечания
1.2 Разработка модели функции плотности вероятности яркости неподвижных цифровых изображений
1.2.1 Классификация гистограмм распределения яркости различных неподвижных изображений
1.2.2 Обоснование процедуры аппроксимации гистограммы изображений многокомпонентным бета-распределением
1.3 Разработка модели пространственных автокорреляционных функций неподвижных цифровых изображений
1.4 Разработка модели подвижных изображений
1.4.1 Типы моделей подвижных цифровых изображений
1.4.2 Первый тип модели
1.4.3 Второй тип модели
1.4.4 Третий тип модели
1.4.5 Комбинированный тип модели
1.5 Разработка модели временной автокорреляционной функции подвижных изображений
1.6 Разработка модели шумов и искажений на цифровых изображениях
1.6.1 Основные типы шумов на цифровых изображениях
1.6.2 Обоснование модели формирования шума на
цифровых изображениях
1.6.3 Основные виды искажений на цифровых изображениях
1.7 Выводы
2 РАЗРАБОТКА АЛГОРИТМОВ СЖАТИЯ НЕПОДВИЖНЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ
2.1 Вводные замечания
2.2 Алгоритм сжатия изображений на основе оптимального выбора базиса из известных базисных систем
2.3 Синтез базиса вейвлет-пакетного разложения по критерию минимума ошибки восстановления исходного изображения при фиксированном коэффициенте сжатия
2.3.1 Постановка задачи
2.3.2 Решение задачи синтеза базисной системы
2.4 Алгоритм одновременной фильтрации и сжатия изображений на основе вейвлет-пакетного разложения
2.5 Выводы
3 ПРАКТИЧЕСКИЕ АСПЕКТЫ РЕАЛИЗАЦИИ АЛГОРИТМОВ СЖАТИЯ ВИДЕОДАННЫХ С ИСПОЛЬЗОВАНИЕМ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ И РАЗЛИЧНЫХ АЛГОРИТМОВ КОМПЕНСАЦИИ ДВИЖЕНИЯ
3.1 Вводные замечания
3.2 Построение функции градационного преобразования для повышения качества визуального восприятия неподвижных цифровых изображений
3.3 Алгоритм сжатия видеоданных с потерями на основе вейвлет-пакетного разложения и разностного кодирования
3.4 Алгоритм сжатия видеоданных на основе вейвлет-пакетного разложения и математической модели предсказания
вектора движения
3.5 Основные критерии определения качества цифровых
изображений
3.5.1 Классические объективные критерии определения качества цифровых изображений
3.5.2 Универсальный индекс качества цифровых
изображений
3.5.3 Субъективное измерение качества цифровых
изображений
3.6 Исследование влияния формата представления чисел на эффективность практической реализации алгоритмов сжатия видеоданных
3.7 Аппаратно-программная реализация алгоритмов сжатия видеоданных
3.8 Выводы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А СПИСОК АББРЕВИАТУР И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
ПРИЛОЖЕНИЕ В КОПИИ АКТОВ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ
Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Эффективные по критерию минимума дисперсии ошибки восстановления и вычислительным затратам алгоритмы обработки случайных процессов на основе обобщенных вейвлетных разложений в радиотехнических устройствах2004 год, кандидат технических наук Зорин, Сергей Валентинович
Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных2013 год, кандидат технических наук Рубина, Ирина Семеновна
Оптимальные алгоритмы восстановления и вейвлет-анализа финитных во времени сигналов в радиотехнических устройствах2007 год, кандидат технических наук Бахурин, Сергей Алексеевич
Разработка алгоритмов стабилизации и компрессии изображений для систем видеонаблюдения мобильных робототехнических комплексов2008 год, кандидат физико-математических наук Коплович, Евгения Александровна
Обработка изображений двумерными нерекурсивными цифровыми фильтрами2010 год, доктор технических наук Приоров, Андрей Леонидович
Введение диссертации (часть автореферата) на тему «Эффективные алгоритмы обработки и сжатия цифровых изображений и видеоданных на основе вейвлет-пакетного разложения»
ВВЕДЕНИЕ
Актуальность темы. В настоящее время значительно возрос интерес к различным методам обработки и сжатия цифровых изображений и видеоданных. Это связано с развитием таких отраслей науки и техники как исследование дальнего и ближнего космоса, компьютерная графика, правоохранительная деятельность, цифровое телевидение и др., где информация имеет характер подвижных и неподвижных изображений. При этом различные видео потоки необходимо хранить и передавать по каналам передачи информации с ограниченной пропускной способностью. Поэтому необходимо применять различные эффективные алгоритмы сжатия данных, с целью экономии места на физических носителях информации и снижения требований к используемым каналам передачи информации. Кроме этого с развитием цифрового телевидения растет интерес к стандартам сжатия, работающим в реальном масштабе времени, для передачи видеоданных в прямом эфире. Большой вклад в развитие теории обработки и сжатия цифровых изображений и видеоданных внесли отечественные и зарубежные ученые Грузман И.С., Киричук B.C., Претт У., Гонсалес Р., Вудс Р., Фриден Б., Сикорский Д.А., Воробьев В.И., Грибунин В.Г., Добеши И., Ярославский Л.П., Хуанг Т.С., Эклунд Дж.-О., Красильников H.H. и др. [1... 10].
Однако современные алгоритмы обработки цифровых изображений носят в большинстве случаев эмпирический характер и не опираются на адекватную статистическую модель амплитуды яркости точек цифровых снимков. Основное преимущество использования статистических моделей состоит в возможности синтеза различных оптимальных алгоритмов обработки цифровых изображений, а также модернизации существующих алгоритмов гис-тограммных преобразований, направленных на улучшение визуального качества снимков, получаемых с помощью различных систем регистрации. При этом исследования, посвященные статистической обработке цифровых изо-
бражений, в интересах разработки адекватных моделей цифровых изображений до настоящего времени проводились в ограниченном объеме. В свиязи с этим актуальной является задача разработки адекватной статистической модели амплитуд яркости точек цифровых изображений, которая включает функцию плотности вероятности (ФПВ), функцию распределения (ФР), корреляционную функцию (КФ) а также математическую модель подвижных изображений.
В свою очередь любая система формирования создает изображение, в котором содержится шум. Шум является неизбежным негативным фактором при решении задач обработки изображений, поэтому для борьбы с ним разработано большое количество методов и алгоритмов. Однако применение тех или иных подходов для борьбы с шумами существенно зависит от их природы и математической модели. Таким образом, необходимо построить их статистическую модель, которая позволит синтезировать оптимальные алгоритмы фильтрации различного рода шумов на цифровом изображении.
В настоящее время для сжатия цифровых изображений получил широкое распространение аппарат вейвлет-пакетного разложения (ВПР) [7]. В работах [3, 6] показано, что зрительная система человека воспринимает искажения вносимые ВПР в меньшей степени, чем искажения от дискретного косинусного преобразования (ДКП). Декоррелирующие свойства ВПР в основном зависят от выбора базисной функции разложения. В [7] разработана концепция кратномасштабного анализа, а также алгоритмы сжатия изображений и видеоинформации [3, 6]. Однако в общем случае отсутствуют практические рекомендации по выбору базисной системы для обработки заданного сигнала, а все разрабатываемые алгоритмы основаны на эмпирическом выборе системы разложения. Таким образом, актуальна задача разработки алгоритма сжатия цифровых изображений на основе ВПР с оптимальной базисной системой на каждом уровне разложения.
Известные вейвлет-базисы [7] были получены без учета априорной информации об обрабатываемом сигнале, а значит, они не могут обеспечивать минимум СКО восстановления для конкретного класса сигналов. К тому же, базисные функции не позволяют путем параметрического синтеза изменять свои свойства и тем самым повышать качественные характеристики устройств обработки изображений. Исходя из этого, необходимо синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе разработанной статистической модели.
При аппаратно-программной реализации алгоритмов обработке и сжатия цифровых изображений, достигнутые характеристики могут значительно отличаться от полученных с помощью имитационного моделирования. Поэтому большое значение имеет исследование эффективности предложенных алгоритмов обработки и сжатия цифровых изображений при использовании различных форматов представления данных, применяемых в современных процессорах. Кроме того, необходим анализ возможности программной реализации разработанных алгоритмов на современной элементной базе в реальном масштабе времени.
Цель и задачи работы. Основной целью данной работы является разработка эффективных алгоритмов обработки и сжатия цифровых изображений на основе статистической модели яркости цифровых снимков, обеспечивающих максимальный коэффициент сжатия при заданной ошибке восстановления. Поставленная цель работы достигается решением следующих задач:
ных цифровых изображений и проанализировать временные корреляционных функции подвижных цифровых изображений, а также проанализировать модель движения объектов, присутствующих на видеопоследовательности, необходимую для построения кадрового предсказателя.
2 Разработать алгоритм сжатия цифровых изображений с применением оптимальной по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления базисной системы из семейства известных вейвлет функций на каждом уровне ВПР, а также синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе статистической модели.
3 Обосновать алгоритм одновременной фильтрации и сжатия зашум-ленных цифровых изображений с использованием ВПР и оптимальной функции терешелдинга вейвлет-коэффициентов.
4 Разработать алгоритм сжатия видеоданных на основе ВПР с оптимальным выбором базиса класса Добеши на каждом уровне разложения и разностного кодирования с предсказанием.
5 Оптимизировать разработанные алгоритмы с целью уменьшения вычислительных затрат и проанализировать возможности аппаратно-программной реализации предложенных алгоритмов сжатия видеоданных на современной элементной базе.
Методы проведения исследований. В работе использовались методы статистической радиотехники, математической статистики, матричного исчисления, численные методы вычислительной математики. Данные теоретические методы сочетались с экспериментальными исследованиями.
1 Показана возможность представления аналитической статистической модели цифровых изображений в виде многокомпонентного бета-распределения. Разработана процедура аппроксимации ФПВ многомодового случайного процесса многокомпонентным бета-распределением, которая обеспечивает оценку статистики хи-квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
2 Доказана целесообразность применения комбинированного критерия для поиска параметров модели ФПВ и ФР в виде многокомпонентного распределения, который обеспечивает статистику хи- квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
3 Предложены различные модели взаимного движения фоторегистри-рующего устройства и снимаемой сцены, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению с известным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра.
4 Получен оптимальный базис в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Показано, что применение данного базиса обеспечивает коэффициент сжатия на 18% выше по сравнению со стандартом JPEG, при одинаковом качестве восстановления и не уступает JPEG 2000. Однако за счет использования статистического кодирования по Хаффману в предложенном алгоритме в несколько раз снижаются требования к вычислительным затратам по сравнению с JPEG 2000, который использует арифметическое сжатие.
сжатия, по сравнению с базисом в классе Добеши. Показана целесообразность синтеза оптимальной базисной системы на каждом уровне разложения, и предложен алгоритм подобного синтеза на основе оценки ПАКФ коэффициентов аппроксимации ВПР. Использование данного подхода позволило дополнительно повысить коэффициент сжатия на 8...9% по сравнению с оптимальным базисом в классе Добеши на каждом уровне разложения.
6 Разработан алгоритм сжатия видеоданных на основе ВПР с синтезированной базисной системой и разностного кодирования. Произведена оптимизация данного алгоритма от количества разностных кадров между двумя опорными для достижения максимально возможного коэффициента сжатия при одинаковом визуальном качестве восстановления. Показано, что при количестве разностных кадров равном 21 данный алгоритм обеспечивает коэффициент сжатия 50 раз при хорошем визуальном качестве восстановления.
7 Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, которая представляет собой совокупность разработанных моделей взаимного перемещения фоторе-гистрирующего устройства и снимаемой сцены . Показано, что использование кадрового предсказателя позволяет получить коэффициент сжатия 80 раз при хорошем качестве восстановления.
Достоверность. Достоверность полученных в диссертационной работе результатов и выводов обеспечивается качественным и количественным сопоставлением результатов экспериментальных исследований с известными положениями теории обработки и сжатия цифровых изображений и видеоданных.
Практическая ценность работы. Предложенные в работе алгоритмы обработки и сжатия цифровых подвижных и неподвижных изображений могут быть использованы в различных радиотехнических системах (РТС), в частности в системах передачи информации и телевидения, в системах видео-
конференций, охранных системах видеонаблюдения, а также при сжатии высоко-динамичных видеоизображений. Реализация результатов исследований позволит снизить требования к пропускной способности линии передачи, а также уменьшить необходимый объем запоминающих устройств, что обеспечит улучшение показателей качества всей РТС.
Результаты диссертационной работы нашли применение в разработках ОАО «Российские космические системы» (ФГУП РНИИ «Космического приборостроения) и в учебном процессе ФГБОУ ВПО «Рязанский государственный радиотехнический университет», что подтверждено соответствующими актами.
Основные положения, выносимые на защиту.
1 Алгоритм сжатия цифровых изображений с использованием оптимальных по критерию максимума коэффициента сжатия при заданном качестве восстановления базисов класса Добеши на каждом уровне разложения ВПР, который обеспечивает коэффициент сжатия на 24% больше по сравнению с JPEG.
2 Процедура аппроксимации ФПВ и ФР яркости цифровых изображений многокомпонентным бета-распределением, по комбинированному критерию поиска параметров модели ФПВ и ФР, позволяющая при эквализации обеспечить в 1,57 раз меньшую неравномерность гистограмм анализируемых снимков.
3 Алгоритм сжатия видеоданных, работающий в реальном масштабе времени, использующий ВПР с оптимальным базисом на каждом уровне разложения и математическую модель предсказания вектора движения и обеспечивающий коэффициент сжатия до 80 раз при хорошем качестве восстановления исходной видеопоследовательности.
1) 53-СНТК, Рязань: РГРТУ, 2006г.
2) Всероссийская НТК студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании» г. Рязань: РГРТУ 2007г.
3) 32-я и 33-я научно-практическая конференция «Сети системы связи и телекоммуникации» г.Рязань: РВВКУС 2007, 2008 г.г.
4) Научная сессия МИФИ-2007.. Москва: МИФИ, 2007г.
5) Доклады на 9-й, 10-й и 11-й Международной конференции «Цифровая обработка сигналов и ее применение» Москва, 2007, 2008, 2009 г.г.
6) 15-я, 16-я и 17-я Всероссийская научно-техническая конференция «Современное телевидение» М.: ФГУП МКБ «Электрон» Москва, 2008, 2009, 2010 г.г.
7) 5-я МНТК К.Э Циолковский - 150 лет со дня рождения. Космонавтика. Радиоэлектроника. Геоинформатика. Рязань, 2007.
8) Материалы 15-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань: РГРТУ, 13-15 февраля 2008 г.
9) 13-я Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов. НИТ, Рязань, 2008
10) 34-я всероссийская научно-техническая конференция «Информационные и телекоммуникационные технологии. Подготовка специалистов для инфрокоммуникационной среды» Рязань, 2009.
Публикации. По теме диссертации опубликовано 21 работа, из них -4 статьи в журналах из списка ВАК, 17 тезисов докладов на международных и всероссийских конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы из 126 наименований и 2-х приложений. Диссертация содержит 183 е., в том числе 130 с. основного текста, 7 таблиц и 85 рисунков.
Благодарности. Автор выражает искреннюю признательность научному руководителю: д. т. н., проф. Кириллову С.Н. за неоценимую помощь и огромную моральную поддержку, оказанную в процессе работы над диссертацией. Автор также благодарит своих коллег, аспирантов и сотрудников кафедры Радиоуправления и связи РГРТУ за высказанные замечания, содействие и помощь в процессе работы и оформлении диссертации. Выражаю особую благодарность своим родным и близким за предоставленную возможность заниматься научной деятельностью.
1 РАЗРАБОТКА И ИССЛЕДОВАНИЕ
СТАТИСТИЧЕСКОЙ МОДЕЛИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ВИЗУАЛЬНОГО ВОСПРИЯТИЯ
1.1 Вводные замечания
Для обработки стационарных случайных процессов (СП) и полей широкое распространение получили алгоритмы, основанные на использовании статистических моделей функции плотности вероятности. [1, 2 и др.]
В настоящее время разработан и с успехом применяется мощный статистический аппарат для различных прикладных задач обработки стационарных СП и полей, в радиолокации, радионавигации, связи, теории массового обслуживания и др.[2]
При обработке цифровых изображений амплитуды яркости точек относятся к классу квазистационарных СП [1], поскольку амплитуда и размеры любых снимков ограничены. Так как сами снимки могут содержать разнообразную информацию, то на некоторых участках стационарность может нарушаться [1, 2] но в целом основные статистические характеристики (математическое ожидание, дисперсия, ФПВ, ФР и КФ) остаются квазипостоянными [2]. При этом исследования, посвященные статистической обработке, основанной на адекватных моделях цифровых изображений до настоящего времени проводились в ограниченном объеме.
На данный момент разработано большое количество алгоритмов выравнивания (эквализации) и видоизменения гистограмм яркости цифровых изображений, для улучшения визуального качества снимков. При этом большинство алгоритмов гистограммной обработки цифровых снимков носят
чисто эмпирический или вычислительный характер и не используют аналитическую статистическую модель, которая включает в себя ФПВ, ФР и КФ .
Основное преимущество использования статистических моделей состоит в возможности синтеза различных оптимальных алгоритмов обработки цифровых изображений, а также модернизации существующих алгоритмов гистограммных преобразований, направленных на улучшение визуального качества снимков, получаемых с помощью различных систем регистрации. Статистическая модель позволит определить функцию градационного преобразования для алгоритмов эквализации цифровых изображений и записать ее аналитически.
Кроме этого, использование аналитических пространственных КФ значительно упростит подбор различных декоррелирующих преобразований для эффективного удаления избыточности цифровых снимков, что позволит получить более высокий коэффициент сжатия при одинаковом качестве восстановления сигналов.
Помимо неподвижных цифровых изображений существуют большие классы видеоданных, таких как видеофильмы и файлы мультимедиа, данные с систем визуального наблюдения и контроля, а также аэровидеосъемки подстилающей поверхности и др. Из анализа работ [1...3,8,10] известно, что видеокадры обладают сильными корреляционными связями во времени, однако для определенных классов видеоданных анализ данных связей не проводился в полной мере, а существующие стандарты сжатия видеоданных в основном используют оценку векторов движения или простейшие разностные алгоритмы. В связи с этим целесообразно уточнить корреляционную модель видеоданных для построения оптимального корреляционного предсказателя кадров видеопоследовательности.
ласти по изображению, а его амплитуда характеризует скорость данного перемещения. Однако оценка вектора движения достаточно трудоемкий вычислительный процесс и требует значительных временных ресурсов, кроме этого для подобных алгоритмов необходима буферизация видеокадров, что создает значительные трудности при построении алгоритма сжатия видеоданных в реальном масштабе времени. Исходя из этого, в некоторых случаях целесообразно использовать различные модели предсказания видеокадров, основанные на априорной информации о движении камеры относительно снимаемой панорамы, а также перемещении объектов в получаемом видеоряде. В данном случае понятие вектора движения можно применить или ко всему кадру или к нескольким достаточно крупным его частям, что существенно снижает требования к вычислительным ресурсам при оценке векторов движения в видеопоследовательности. Таким образом, целесообразно разработать алгоритм сжатия видеоданных, основанный на совместном использовании корреляционного предсказателя и модели формирования кадра, для оценки текущего вектора движения.
В свою очередь любая система формирования создает изображение, в котором содержится шум. Шум является неизбежным негативным фактором при решении задач обработки изображений, поэтому для борьбы с ним разработано большое количество методов и алгоритмов. Однако применение тех или иных подходов для борьбы с шумами существенно зависит от их природы и математической модели. Таким образом, необходимо построить их статистическую модель, которая позволит синтезировать оптимальные алгоритмы фильтрации различного рода шумов на цифровом изображении. Кроме шумов цифровые изображения подвержены влиянию различных искажающих факторов, основным из которых для аэрофотосъемки земной поверхности является влияние оптической турбулентности атмосферы. Данное явление обусловлено случайным изменением коэффициента преломления среды по трассе наблюдения, что вызывает искривление волнового фронта и приво-
дит к размытию цифрового снимка в картинной плоскости. В работах [2,4,5] проведена оценка ФР интенсивности кружка рассеяния турбулентной атмосферы, которая называется функцией рассеяния точки. Показано [5], что максимальный угловой раствор усредненной апертурной функции турбулентной среды составляет 16 угловых секунд, что свидетельствует о значительном влиянии оптической неоднородной среды.
Исходя из вышеперечисленного, в первой главе работы для разработки статистической модели цифровых изображений, а также алгоритмов, основанных на данной модели необходимо решить следующие задачи:
1. Разработать аналитическую статистическую модель ФПВ неподвижных цифровых изображений.
2. Провести экспериментальные исследования и получить аналитическую запись пространственных корреляционных функций неподвижных цифровых изображений.
3. Проанализировать временные корреляционные функции подвижных цифровых изображений.
4. Разработать модель движения объектов, присутствующих на видеопоследовательности, необходимую для построения кадрового предсказателя.
5. Построить математическую модель шумов и искажений на цифровых изображениях, а также методику оценки их основных характеристик.
1.2 Разработка модели функции плотности вероятности яркости неподвижных цифровых изображений
1.2.1 Классификация гистограмм распределения яркости различных неподвижных изображений
Цифровое черно-белое изображение в градации серого неподвижное изображение определяется как двумерная функция Y = (р(х,у), где х и у - координаты точек на плоскости, a Y{xn,ym) = ср(хп,ут) - значение интенсивности или уровень яркости точки цифрового изображения. Таким образом, под неподвижным изображением понимается функция двух пространственных переменных, заданная на ограниченной прямоугольной области [2, 3].
При этом совокупность значений Y(xn,ym) = (р(хп,ут) n = l,N т = \,М, где N и М соответственно ширина и высота изображения в пикселях, а начало координат находится в левом верхнем углу, представляет собой дискретный СП с соответствующими ФПВ и КФ. Если изображение цветное в системе RGB, то оно определяется как Yn =(p(x,y,[R,G,BJ) в данном случае
Уц(хп,ут,С) = <р(хп,ут,С) - значения интенсивности цветовой составляющей, а С = 1,2,3 - вид цветовой матрицы, к которой относится данная интенсивность (R-Красный, G-Зеленый и В-Синий). В литературе известно значительное число цветовых систем [2, 3], результатом применения той или иной системы определения цвета является значение цветового оттенка конечной точки с координатами (хп,ут).
Для оценки ФПВ яркости черно-белого неподвижного изображения в градации серого целесообразно использовать гистограмму распределения, где под гистограммой цифрового изображения [3] с уровнями яркости [0, Lm] понимается дискретная функция вида:
Guih) = nk,k = UZ, (1.1)
17
здесь к - номер интервала гистограммной оценки, гк - ширина дифференциального коридора (шага) гистограммы, а пк -число пикселей на изображении, попавших в коридор гк, ктах - число интервалов гистограммной оценки.
Для получения оценки ФПВ необходимо выполнить нормировку гистограммы СП:
GH=Gu(rk)/(N-M). (1.2)
При этом важным вопросом является выбор ширины дифференциального коридора гистограммной оценки гк. В [3] предложено количество интервалов гистограммной оценки кптх выбирать равным количеству уровней
квантования значений яркости цифровых изображений. В этом случае наблюдается большая изрезанность гистограммы, что приводит к значительным сложностям при определении ярко выраженных мод, однако позволяет существенно повысить точность при оценке различных моментных функций.
В связи с этим необходимо выбирать такое количество интервалов ктяк, которое обеспечит умеренную изрезанность гистограммы с сохранением приемлемой точности оценки моментных функций. Как показано в [8], для анализа гистограмм различных изображений в градации серого от 0 до 255 количество интервалов гистограммной оценки ФПВ целесообразно выбрать не более 30, при этом наблюдается умеренная изрезанность гистограммы изображения, а точность оценки моментных функций высокого порядка уменьшается не более чем на 5...7% по сравнению с гистограммой, где количество интервалов равно количеству уровней квантования.
При обработке изображений с целью повышения их качества фактически необходимо рассматривать два изображения - исходное (целевое) и реальное. Исходное - это изображение, которое было бы получено, если в системе формирования не действовали различные мешающие явления в виде искажений и шумов.
Реальное - это изображение, полученное при действии системы мешающих факторов, которое имеет в своем распоряжении пользователь и качество которого необходимо повысить. Если в нашем распоряжении имеется исходное и реальное изображение, то на основе различий между ними можно установить мешающие факторы, действующие в системе и выполнить коррекцию системы формирования. Однако на практике, в распоряжении пользователя всегда имеется только реальное изображение. Поэтому исходное изображение используется только при создании методов и алгоритмов обработки цифровых снимков для построения соответствующих моделей, а также сравнения и оценки качества результатов обработки. Реальное изображение можно использовать только если заранее обоснованы модели шумов и других искажений, которые присутствуют на обрабатываемом снимке.
В настоящее время существует большое количество классов цифровых изображений, таких как портретные и пейзажные снимки, рентгеновские снимки и другие [3]. При построении статистической модели яркости целесообразно рассматривать отдельный класс изображений, для которого строится указанная модель.
Рассмотрим класс изображений, которые получены с помощью аэрофотосъемки ландшафта земной поверхности и различных застроек в градации серого от 0 до 255. Для экспериментальных исследований использовались снимки, на которых присутствуют однородные поверхности, переходы от одной подстилающей поверхности к другой, различного рода постройки, кроме этого рассматривались снимки содержащие разноплановые объекты.
Проведенные в рамках работы экспериментальные исследования ФПВ яркости 400 монохромных неподвижных изображений указанного класса в градации серого [0, 255], показали, что в 96 % случаев число ярко выраженных мод не превышает трех, причем 32 % исследованных изображений имели одну моду, 47 % две моды 17 % три моды и только 4 % содержали четыре
или более мод, но при этом общее количество мод не превышало шести (таблица 1.1).
Таблица 1.1 - Доля гистограмм изображений с различным содержанием мод
Количество мод 1 2 3 . 4 Более 4-х
Доля снимков, % 32% 47% 17% 2,8% 1,2%
Проведенные исследования показали, что существует взаимосвязь между числом ярко выраженных мод и типом неподвижного изображения.
Одномодовые гистограммы характерны для однородных изображений, без мелких объектов, застроек и водоразделов (снимки полей, различных однородных поверхностей и т.д., рисунок 1.1).
Двумодовые гистограммы наблюдаются на изображениях, где присутствует переход от одной подстилающей поверхности к другой (водоразделы, реки, лес и поле и т.д. рисунок 1.2).
Трехмодовые гистограммы чаще встречаются у изображений, на которых присутствуют различного рода постройки, дома, дороги, а также много мелких однотипных объектов (рисунок 1.3).
Наличие четырех и более мод свидетельствует о значительном количестве разноплановых объектов на изображении (рисунок 1.4 и рисунок 1.5 соответственно).
Таким образом, исходя из анализа неподвижных снимков земной поверхности следует вывод о том, что в 96 % случаев необходимо анализировать изображения с количеством мод не более 3-х, причем по количеству мод возможно произвести предварительную классификацию содержимого изображения.
а
0.01
0.008
0.006
0.004
0.002
1_л1
И
I
" 111111111
к.1
50
100
150
200
7
1.2.2 Обоснование процедуры аппроксимации гистограммы изображений многокомпонентным бета-распределением
Известно большое количество алгоритмов обработки цифровых изображений с использованием исходных гистограммных преобразований [9, 10 и др.]. Однако алгоритмы указанных преобразований в большинстве случаев используют гистограмму яркости изображения, что приводит к большим вычислительным затратам и к сложности с обратимостью операций гистограммных преобразований. Кроме этого недостатком данного подхода является невозможность получить оптимальные алгоритмы обработки цифровых снимков, что существенно ухудшает качество подобных процедур.
Поэтому целесообразно в данных алгоритмах использовать аналитическую статистическую модель, описывающую ФПВ амплитуд яркости точек цифрового изображения.
В качестве оценки адекватности предложенной статистической модели возможно использовать различные критерии согласия: хи-квадрат, критерий Колмогорова-Смирнова и др. [11, 13].
Анализируя результаты исследований типов гистограмм изображений предыдущего параграфа, можно сделать вывод о том, что ФПВ амплитуд яркости точек необходимо аппроксимировать моделью в виде многокомпонентного распределения:
где - ФПВ отдельной компоненты, а(- вес соответствующей компо-
ненты р1 (7), при этом должно выполняться условие нормировки:
п
(1.3)
п
Для определения класса ФПВ /?,(Т), которым целесообразно аппроксимировать гистограммы цифровых изображений оценивались моменты /и2, /иъ, ¿и4 одномодовых распределений:
где 0(Ьк) - отсчеты гистограммы исходного изображения соответствующие
центральному значению интервала гистограммной оценки Ьк, а У - среднее значение уровней яркости изображения.
Далее, определялись значения коэффициентов Д, Д2 одномодовых гистограмм по формулам [13]:
После этого на плоскость К. Пирсона [13, 14] наносились точки с координатами Д и Д (рисунок 1.6).
Анализ плоскости К. Пирсона показал, что коэффициенты Д и Д одномодовых гистограмм распределений яркости изображений, которые получены с помощью аэрофотосъемки ландшафта земной поверхности и различных застроек в градации серого от 0 до 255, в основном (99%) сосредоточены в области 1-го типа на плоскости К. Пирсона (область бета-распределения).
При этом было проанализировано 200 одномодовых гистограмм, а отдельные значения моментов и соответствующих им коэффициентов Д и Д представлены в таблице 1.2.
к.
(1.5)
Д=/А!/4.' д =
(1.6)
проанализированы по критерию согласия хи-квадрат следующие типы распределений: нормальное, логнормальное и гамма-распределение [11, 15, 16].
А
О 0,1 ОД 03 0,4 0,5 0,6 0л 0,8 0,9 1,0 1,1 1,2. 1,3 1,4 1,5 1,6 1,7 1,8
Рисунок 1.6 - Плоскость К. Пирсона
Таблица 1.2 - Моменты и моментные отношения амплитуд яркости точек отдельных изображений
№ изобр. ¡л2 /лЪ !лА /и /32 Тип
1 64,37 -134,48 13081,00 0,07 3,16 I
2 75,46 -83,83 17255,00 0,02 3,03 I
3 26,81 -58,41 2039,10 0,18 2,84 I
4 51,985 -104,31 6701,50 0,08 2,48 I
5 86,20 246,47 23598,00 0,09 3,18 I
6 75,22 -137,84 16675,00 0,04 2,95 I
7 181,03 329,81 88976,00 0,02 2,72 I
8 95,28 149,03 29022,00 0,03 3,20 IV
9 48,175 -123,69 7052,50 0,14 3,04 I
10 33,10 -72,97 3166,30 0,15 2,89 I
Для всех указанных моделей характерна унимодальная колоколообраз-ная форма ФПВ. Аппроксимация гистограмм перечисленными выше моделями, кроме бета-распределения, осуществлялась при равенстве первых двух моментов (математического ожидания и дисперсии) гистограммы и теоретического закона ФПВ. Усредненные по 100 опытам результаты сравнения выбранных моделей по критерию согласия хи-квадрат с доверительным интервалом 5% и 95% доверительной вероятностью представлены в таблице 1.3
Таблица 1.3 — Сравнение моделей аппроксимации по количество принятых гипотез в соответствии с критерием согласия хи-квадрат
Распределение Нормальное Логнормальное Бета-распределение Гамма-распределение
Принятые гипотезы 74% 65% 89% 60%
Из анализа таблицы 1.3 можно сделать вывод о том, что одномодовые ФПВ изображений рассматриваемого класса с доверительным интервалом 5% и 95% доверительной вероятностью лучше аппроксимируются бета-распределением. Тем более, что нормальное, логнормальное и гамма-распределение определены на интервале (-оо,оо) или (0,оо), что абсолютно
не учитывает специфику ограниченности значений точек яркости изображений отрезком [0, 255]. Даже для восьмого случая в таблице 1.2, когда наилучшим является IV тип распределения К. Пирсона, хорошие результаты (значение статистики хи-квадрат 1,91) дает аппроксимация гистограммы ФПВ в виде бета-распределения.
В свою очередь, бета-распределение определено на ограниченном отрезке [а, в] и легко масштабируется путем линейного преобразования к интервалу [0, 255], что в отличие от других рассмотренных распределений согласуется с ограниченностью значений яркости рассматриваемых цифровых изображений.
Кроме этого бета-распределение является более гибким в отношении формы ФПВ, т.е. задания коэффициентов асимметрии и эксцесса.
В связи с этим в рамках данной работы предложено для аппроксимации ФПВ i-ой компоненты использовать бета-распределение вида [14]:
где B{ju,v) - бета функция, /u,v - параметры бета-распределения, а Y = Y/Y Y = 256
Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Разработка и исследование методов и алгоритмов сжатия и восстановления видеоданных в цифровых телевизионных системах2009 год, кандидат технических наук Некрасов, Вадим Владимирович
Методы и алгоритмы вейвлет-кодирования зашумленных изображений в радиотехнических системах2009 год, доктор технических наук Бехтин, Юрий Станиславович
Сжатие статических изображений с постоянной скоростью сжимающего кодирования в задачах дистанционного зондирования Земли2006 год, кандидат технических наук Книжный, Игорь Михайлович
Разработка методов и устройств компенсации пространственно-временных искажений в системах цифрового телевидения2008 год, кандидат технических наук Поляков, Дмитрий Борисович
Математические методы и алгоритмы цифровой компрессии изображений с использованием ортогональных преобразований2001 год, доктор физико-математических наук Умняшкин, Сергей Владимирович
Заключение диссертации по теме «Радиотехника, в том числе системы и устройства телевидения», Косткин, Иван Вячеславович
Основные результаты диссертационной работы можно сформулировать в следующем виде:
1 Показана возможность представления аналитической статистической модели цифровых изображений в виде многокомпонентного бета-распределения. Разработана процедура аппроксимации ФПВ многомодового случайного процесса многокомпонентным бета-распределением, которая обеспечивает оценку статистики хи-квадрат в доверительном интервале 5% с 95% доверительной вероятностью.
2 Доказана целесообразность применения комбинированного критерия для поиска параметров модели ФПВ и ФР в виде многокомпонентного распределения, который обеспечивает статистику хи-квадрат в доверительном интервале 5% с 95%) доверительной вероятностью.
3 Обоснована возможность использования функции (1.20) для аналитической аппроксимации ПАКФ цифровых изображений с погрешностью менее 5% по среднеквадратическому критерию (1.19).
4 Предложены различные модели движения, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению со стандартным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра (1.24).
5 Проанализирована АКФ пикселей по времени и получена корреляционная карта видеопоследовательностей рассматриваемого класса, которая позволяет провести разбиение видеопоследовательности на медленно и сильно меняющиеся области. Учитывая данные области можно производить более эффективное предсказание последующих кадров на основе многоканального корреляционного предсказателя, что позволит получить более высокое сжатие видеоданных при фиксированном качестве восстановления. Показано, что данный алгоритм проигрывает попиксельному (наилучшему) КП на 3.4%, однако требует в среднем в 6,5 раз меньших вычислительных затрат.
6 Проанализированы различные модели формирования шума на цифровом изображении и обоснована наиболее адекватная из них модель, описываемая выражением (1.46). Проанализированы основные виды искажений цифровых изображений.
7 Получен оптимальный базис в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Показано, что применение данного базиса обеспечивает на 18% более высокое сжатие по сравнению со стандартом JPEG, при одинаковом качестве восстановления и не уступает JPEG 2000. Однако за счет использования статистического кодирования по Хаффману в предложенном алгоритме в несколько раз снижаются требования к вычислительным затратам по сравнению с JPEG 2000, который использует арифметическое сжатие.
8 Произведен синтез оптимальной базисной системы на основе ПАКФ изображений, разработанной в первой главе, которая обеспечивает на 24% больший коэффициент сжатия, по сравнению с базисом в классе Добеши.
9 Показана целесообразность синтеза оптимальной базисной системы на каждом уровне разложения, и предложен алгоритм подобного синтеза на основе оценки ПАКФ коэффициентов аппроксимации ВПР. Использование данного подхода позволило дополнительно повысить коэффициент сжатия на 8.9% по сравнению с оптимальным базисом в классе Добеши на каждом уровне разложения.
10 Разработан алгоритм одновременной фильтрации и сжатия цифровых изображений, который позволил получить при Ксж = 10 значение ПОСШ на 4дБ выше, по сравнению со случаем фильтрации всех коэффициентов ВПР и на 13дБ выше по сравнению со случаем отсутствия фильтрации. Использование предварительного сжатия в предложенном алгоритме позволило уменьшить вычислительные затраты на 20.30%.
11 Предложена комбинированная функция трешелдинга, которая позволила осуществить сжатие и получить дополнительный выигрыш при подавлении шумов на цифровых изображениях в среднем на 2. .4 дБ.
12 Предложена модернизация алгоритма эквализации гистограммы цифровых изображений на основе многокомпонентного бета-распределения, который позволяет выполнять обратные преобразования, а также хранить информацию об исходной ФПВ в виде параметров модели, кроме этого предложенный алгоритм эквализации позволяет получить в 1,57 меньшую неравномерность, чем известный алгоритм выравнивания гистограммы.
13 Разработан алгоритм сжатия видеоданных на основе ВПР с синтезированной базисной системой и разностного кодирования. Произведена оптимизация данного алгоритма от числа разностных кадров для достижения максимального коэффициента сжатия при одинаковом качестве восстановления исходного видеоряда. Показано, что при числе разностных кадров равном 21 данный алгоритм обеспечивает коэффициент сжатия 50 раз при хорошем визуальном качестве восстановления.
14 Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, разработанной в первой главе. Показано, что использование кадрового предсказателя позволяет получить коэффициент сжатия 80 раз при хорошем качестве восстановления.
15 Проведены исследования влияния формата представления чисел на эффективность алгоритмов сжатия специфических видеоданных. Показано, что использование более экономичного 32-битного формата представления не приводит к ухудшению характеристик указанных алгоритмов.
16 Проведен анализ современной элементной базы и выбран наиболее подходящий ЦСП, который обеспечивает достаточное быстродействие системы для работы предложенных алгоритмов в реальном масштабе времени.
Таким образом, выполнена цель работы, которая заключается в разработке эффективных алгоритмов обработки и сжатия цифровых изображений на основе статистической модели яркости цифровых снимков, обеспечивающих максимальный коэффициент сжатия при заданной ошибке восстановления.
ЗАКЛЮЧЕНИЕ
Разработаны эффективные алгоритмы обработки и сжатия подвижных и неподвижных цифровых изображений. В рамках работы была предложена и исследована аналитическая статистическая модель амплитуды точек яркости цифровых изображений, включающая ФПВ, ФР и ПАКФ. Обоснована возможность использования комбинированного критерия для поиска параметров модели ФПВ и ФР в виде многокомпонентного распределения, который обеспечивает статистику хи-квадрат в доверительном интервале 5 % с 95% доверительной вероятностью. Предложены различные модели движения, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению со стандартным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра.
Определен оптимальный базис ВПР в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Произведен синтез оптимальной базисной системы на основе ПАКФ изображений, разработанной в первой главе. Показано, что использование синтезированного базиса позволят получить дополнительный выигрыш в коэффициенте сжатия, по сравнению с базисом в классе Добеши.
На основе обоснованной в первой главе математической модели предсказания вектора движения, а также предложенных во второй главе оптимальных базисных систем ВПР разработан алгоритм сжатия видеоданных. Показано, что использование данного алгоритма сжатия видеопоследовательностей позволяет существенно увеличить коэффициент сжатия при сохранении хорошего визуального качества восстановленных видеоданных.
Кроме этого предложен алгоритм сжатия видеоинформации без использования кадрового предсказателя, который значительно снижает требования к вычислительным ресурсам.
Проведен анализ современной элементной базы и выбран наиболее подходящий ЦСП, который обеспечивает достаточное быстродействие системы для работы предложенных алгоритмов в реальном масштабе времени.
Список литературы диссертационного исследования кандидат технических наук Косткин, Иван Вячеславович, 2011 год
СПИСОК ИСПОЛЬЗОВАННЫХ источников
1. Грузман И.С., Киричук B.C. Цифровая обработка изображений в информационных системах: учеб. пособие для вузов. Новосибирск: НГТУ. 2002. 352с.
2. Претт У. Цифровая обработка изображений. М.: Мир 1982. т.1 310с.;т.2 790с.
3.Гонсалес Р. Вудс Р. Цифровая обработка изображений. М.: Техносфера. 2006. 600с.
4. Фриден Б. Компьютеры в оптических исследованиях/ пер. с англ. под редакцией Ахманова С.А. М.: Мир. 1983. 248с.
5. Сикорский Д.А. Метод оценки уровня турбулентности атмосферы// электронный журнал «Исследовано в России» режим доступа http://zhurnal.ape.relan.ruarticles/2002/075.pdf
6. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. СПб.: ВУС. 1999. 204с.
7. Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ «Регулярная и хаотическая динамика». 2001. 464с.
8. Ярославский Л.П. Введение в цифровую обработку изображений. М: Сов. радио. 1979. 412с.
9. Хуанг Т.С., Эклунд Дж.-О. Быстрые алгоритмы в цифровой обработке изображений. М.: Радио и связь. 1984. 224с.
10. Красильников H.H. Цифровая обработка изображений. М.: Вузовская книга. 2001. 320с.Наука. 1983. 416с.
11. Тихонов В.И. Статистическая радиотехника: М.: Сов. Радио. 1983. 678 с.
12. Левин Б.Р. Теоретические основы статистической радиотехники М.: Сов. Радио. 1989. 656 с.
13. Болынев JI.H. Смирнов Н.В. Таблицы математической статистики. М.: 1993. 416с.
14. Уилкс С. Математическая статистика М.: Наука. 1967. 400с.
15. Коваленко И.Н., Филиппова А.А. Теория вероятности и математическая статистика. М.: «Высшая школа» 1973. 368с.
16. Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей. М.: Наука 1970. 322с.
17. Гольденберг J1.M. Цифровая обработка сигналов. М.: Радио и связь. 1990. 256с.
18. Coleman, T.F. and Y. Li, "An Interior, Trust Region Approach for Nonlinear Minimization Subject to Bounds," SIAM Journal on Optimization, Vol. 6, pp. 418-445, 1996.
19. Митропольский A.K. Теория моментов. M.: ГИКСЛ 1933. 253с.
20. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. М.: Наука. 1979. 369с.
21. Лоэв М. Теория вероятностей. М.: ИЛ, 1962. 401с.
22. Крамер Г. Математические методы статистики М.: Мир. 1976. 196с.
23. Егорова С.Д., Колесник В.А. Оптико-электронное преобразование изображений. М.: Радио и связь. 1991. 208с.
24. Быков P.E., Манцветов A.A., Степанов H.H., Эйссенгардт Г.А. Преобразователи изображения на ПЗС. М.: Радио и связь. 1992. 184с.
25. Журавель И.М. Краткий курс теории обработки изображений. // http://matlab.exponenta.ru/imageprocess/book2/index.php
26. Моргунов А.Н. Синтезированный одномерный закон распределения случайных процессов и величин в некоторых радиотехнических задачах // Труды Рязанского государственного радиотехнического института «Радиоэлектронные устройства». Рязань: 1975. C33-43.
27. Д.В. Иванов, A.A. Хропов, Е.П. Кузьмин, A.C. Карпов, B.C. Лем-пицкий Алгоритмические основы растровой графики электронный ресурс, режим доступа http://www.intuit.rU/department/graphics/rastrgraph/7/7.html
28. Гольдман С. Теория информации. М.: Иностранная литература. 1957.
29. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. М.: Наука. 1965.
30. Калинкина Д., Ватолин Д. Проблема подавления шума на изображениях и видео и различные подходы к ее решению. 2005. // http://www.w3.org/1999/xhtml
31. Искажения оптического сигнала при его распространении в атмосфере.// www.openhardware.ru/optolink7atmosphere 2/optolink-10 .html
32. Сикорский Д.А. Метод оценки уровня турбулентности атмосферы. // Электронный журнал Исследовано в России. 2002. С824-838 http://zhumal.ape.relam.rn/articles/2002/075.pdf
33. Линдли К. Практическая обработка изображений на языке С. М.: Мир. 1996. 512с.
34. Поляков А.Ю. Методы и алгоритмы компьютерной графики в примерах на Visual С+ + . СПб.: БВХ - Петербург. 2002. 400с.
35. Старка Г. Реконструкция изображений. М.: Мир. 1992. 636с.
36. Быков P.E., Фрайер Р., Иванов К.В., Манцветов A.A. Цифровое преобразование изображений: учеб. пособие для вузов. М.: Горячая линия - Телеком. 2003. 228с.
37. Свиридов К. Виды аберраций (искажений) в цифровых фотоаппаратах // электронный ресурс режим доступа: http://www.mobi.ru/Articles/2266/FAO vidv aberracii iskazhenii v cifr ovvh fotoapparatah.htm
38. Залмасон A.A. Преобразования Фурье, Уолша, Xaapa и их применение в управлении связи и др. М.: Наука. 1989. 496с.
39. Столниц Э., Дероуз Т., Салезин Д. Вейвлеты в компьютерной графике. Ижевск: НИЦ «Регулярная и хаотическая динамика». 2002. 272с.
40. Материалы сайта http://www.kunegin.narod.ru
41. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. // http://compression.graDhicon.ru/
42. Блаттер К. Вейвлет анализ. Основы теории. М.: Техносфера. 2004.280с.
43. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование.// Успехи физических наук. Том 171 №5. 2001. С465-501.
44. Дьяконов В.П. Вейвлеты. От теории к практике. М.: СОЛОН-Р. 2002. 448с.
45. Чуй К. Введение в вейвлеты. М.: «МИР». 2001. 412с.
46. Косткин И.В. Модификация алгоритмов обработки изображений с учетом предлагаемой статистической модели // Всероссийская НТК студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании» г. Рязань : РГРТУ 2007г. С. 128-129.
47. Кириллов С.Н. Косткин И.В. Алгоритм эквализации на основе многокомпонентного бета-распределения яркости изображения // Вестник РГРТА 2007 №21 С. 50-54.
48. Косткин И.В. Алгоритм поровой сегментации с учетом статистической модели цифровых изображений в виде многокомпонентного бета распределения // 32-я научно-практическая конференция «Сети системы связи и телекоммуникации» г.Рязань: РВВКУС 2007г. СЛ79.
49. Корн Г. Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука. 1984. 833с.
50. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных и изображений. // http://compression.ru/
51. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения. - М.: Мир, 1990. - 584 с.
52. Трахтман A.M., Трахтман В.А. Основы теории дискретных сигналов на конечных интервалах. - М.: Сов. радио, 1975. - 208 с.
53. Трахтман A.M. Введение в обобщенную спектральную теорию сигналов. М.: Сов. радио, 1972. 208 с.
54. Вайдьянатхан П.П. Цифровые фильтры, блоки фильтров и полифазные цепи с многочастотной дискретизацией: Методический обзор. // ТИИЭР, 1990. Т.78. №3. С. 77-120.
55. Петухов А.П. Введение в теорию базисов всплесков. - СПб.: Изд-во СПбГТУ, 1999.- 132 с.
56. Р.Гонсалес, Р. Вудс, С. Эддинс Цифровая обработка изображений в среде MATLAB. - М.: Техносфера, 2006. - 616 с.
57. Кравченко В.Ф., Рвачев В.А. «Вейвлет»-системы и их применение в обработке сигналов. // Зарубежная радиоэлектроника, 1996, №4, С. 3-20
58. Новиков И.Я., Стечкин С.Б. Основы теории всплесков. // Успехи математических наук, 1998. т. 53, №6(324), С. 53-128.
59. Косткин И.В. Алгоритм вейвлет-сжатия неподвижных цифровых изображений // Вестник РГРТА 2007 №20 - С. 110-113.
60. ПойдаВ.Н. Спектральный анализ в дискретных ортогональных базисах. Минск: Наука и техника, 1978. 136 с.
61. Трахман, A.M. Введение в обобщенную спектральную теорию сигналов / A.M. Трахман. М.: Сов. радио, 1972 351 с.
62. Кобелев В.Ю. Адаптивное преобразование сигналов // доклады 3-й конференции ЦОС и ее применения Москва 2000.
63. Часто задаваемые вопросы по вевлет-анализу // режим доступа http://matlab.exponenta.ru/wavelet/faq/faq.php
64. Ван Трис Г. Теория обнаружения оценок и модуляции том 1. -М.: Советское радио, 1972. - 744с.
65. Френке Л. Теория сигналов. - М.: Советское радио, 1974. - 344с.
66. Новиков JI.B. Основы вейвлет-анализа сигналов. Учебное пособие. СПб.: Изд-во ООО «МОДУС+», 1999. 152 с.
67. Бехтин, Ю.С. Алгоритм вейвлет-фильтрации зашумленных изображений. // Вестник РГРТА. 2004. - № 15. - С.22-27.
68. Бехтин, Ю.С. Обработка зашумленных изображений на основе вейвлет-преобразований. // Вестник РГРТУ. 2006. - № 18. - С. 141144.
69. Lim, Jae S., Two-Dimensional Signal and Image Processing, Engle-wood Cliffs, NJ, Prentice Hall, 1990, p. 548
70. Дьяконов В.П. Вейвлеты. От теории к практике. - М.: Солон-Р, 2002. 448 с.
71. Астафьева Н.М. Вейвлет-преобразования. Основные свойства и примеры применения. М.: ИКИ РАН, 1994. №1891. 56 с.
72. Берколайко М.З., Новиков И.Я. Базисы всплесков в пространствах дифференцируемых функций анизотропной гладкости. М.: Докл. РАН, 1992, Т. 323, №4, С. 615-618.
73. Желудев В.А. О вейвлетах на базе периодических сплайнов. М.: Докл. РАН, 1994, №1, с. 9-13.
74. Малоземов В.П., Машарский С.М. Сравнительное изучение двух вейвлетных базисов. // Проблемы передачи информации, 2000, т.36, вып. 2, с. 27-37
75. Малоземов В.Н., Машарский С.М. Хааровские спектры дискретных сверток. // Ж. вычисл. мат. и матем. физ., 2000, т.40, №6, с.954-960
76. Новиков И .Я. Онделеты И. Мейера - оптимальный базис в С(0,1). // Матем. Заметки. М., 1992, т.52, №5, С. 88-92.
77. Новиков И.Я., Стечкин С.Б. Основные конструкции всплесков. // Фундаментальная и прикладная математика, 1997, т.З, №4, с. 9991028.
78. Витязев В.В. Вейвлет-анализ временных рядов: Учеб. пособие. СПб.: Изд-во С.-Петерб. ун-та, 2001. - 58 с.
79. Ковалев Э.И., Кучерявенко C.B., Федосов В.П. Вейвлет-анализ для обработки радиотехнических сигналов. Учебное пособие. - Таганрог: ТРТУ, 2004. 60 с.
80. Переберин A.B. О систематизации вейвлет-преобразований // Вычислительные методы и программирование. 2001. Т. 2. С. 15-40.
81. Омельченко В.А. Основы спектральной теории распознавания сигналов. Харьков: Вища школа, 1983. 159 с.
82. Кириллов С.Н., Зорин C.B. Применение алгоритмов вейвлет-анализа для сжатия речевых сигналов в IP-телефонии. // Электросвязь. 2001. №4. С 40-42.
83. Кириллов С.Н., Зорин C.B. Синтез оптимальных порождающих фильтров для вейвлетных разложений. // 4-я Международная конференция "Цифровая обработка сигналов и ее применение". М., 2002. Т. 1.С. 74-76.
84. Кириллов С.Н., Зорин C.B. Реализация алгоритмов вейвлет-анализа на основе рекурсивных фильтров. Радиотехника. 2002. № 3 С. 33-37.
85. Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения. // Успехи физических наук. 1998. Т. 166. №11. С. 1145-1170.
86. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование. // Успехи физических наук. 2001. т. 171. №5. С. 465501.
87. Кириллов С.Н., Зорин C.B. Алгоритмы биортогонального вейв-лет-анализа на основе рекурсивных фильтров. // Цифровая обработка сигналов, 2001. №3 с. 9-12.
88. Кириллов С.Н., Зорин C.B. Оптимальные по минимуму средне-квадратической ошибки вейвлетные представления случайных процессов. // Цифровая обработка сигналов, 2002. № 2. С. 32-35
89. Василенко Г.И. Теория восстановления сигналов: О редукции к идеальному прибору в физике и технике. - М.: Сов.радио, 1979. - 272 с.
90. Василенко Г.И., Тараторин A.M. Восстановление изображений. -М.: Радио и связь, 1986. - 304 с.
91. Тихонов А.Н. О методе регуляризации обратных задач // Кибернетика и вычислительная техника. 1985. Вып. 1. С. 87-99.
92. Светковский P. JI. Метод восстановления сигналов по модулю спектра. // Радиотехника и электроника. 1995. Т40. Вып.1. С. 75-79.
93. Гоноровский И.С. Радиотехнические цепи и сигналы. - М.: Радио и связь, 1986. - 512 с.
94. Шафер Р.У., Мерсеро P.M., Ричарде М.А. Итерационные алгоритмы восстановления сигналов при наличии ограничений // ТИИЭР. 1981. Т69. №3. С. 34-55.
95. Ян Ричардсон Видеокодирование. Н.264 и MPEG-4 - стандарты нового поколения М.: Техносфера, 2005. - 368с.
96. Стандарт MPEG-2 ISO/IEC 13818 (Parti-Parti0)
97. Стандарт MPEG-4 ISO/IEC 14496 (Part 1 -Part22)
98. Стандарт MPEG-4 ISO/IEC 14496 PartlO - H.264
99. Дворкович A.B., Дворкович В.П., Зубарев Ю.Б. и др. под ред. Ю.Б. Зубарева, В.П. Дворковича Цифровая обработка телевизионных и компьютерных изображений М.: Международный центр научной и технической информации, 1997. - 212с.
100. Катаев С.И. Генераторы импульсов телевизионной развертки М.: 1951г.
101. Катаев С.И. Электроннолучевые телевизионные трубки М.: 1936г.
102. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ-МИФИ, 2003. - 3 84с.
103. Арляпов С.А.,Приоров А.Л., Хрящев В.В. Модифицированный критерий оценки качества восстановленных изображений.
104. Стандарт ISO/IEC JTC1/SC29/WG11 №5523 Call for Proposals fpr Extended Sample Bit Depth and Chroma Format Support in Advanced Video Coding Standard, March 2003.
105. ВальпаО.Д. Разработка устройств на основе цифровых сигнальных процессоров фирмы Analog Devices с использованием Visual DSP++. - М.: Горячая Линия - Телеком, 2007. - 270 с.
106. ВасюковВ.Н. Цифровая обработка сигналов и сигнальные процессоры в системах подвижной радиосвязи. - Новосибирск: НГТУ, 2006. - 292 с.
107. Пантелейчук А. Основы выбора цифровых сигнальных процессоров // Электронные компоненты. № 6, 2006. С. 69-72.
108. Kehtarnavaz N. Real-Time Digital Signal Processing Based on the TMS320C6000. - Newnes, 2004. - 320 c.
109. KuoSenM. Digital Signal Processors: Architectures, Implementations, and Applications. - Prentice Hall, 2004. - 624 c.
110. Соловьев B.B. Проектирование цифровых систем на основе программируемых логических интегральных схем. - М.: Горячая Линия - Телеком, 2001. - 636 с.
111. Стешенко В.Б. ПЛИС фирмы «ALTERA»: элементная база, системы проектирования и языки описания аппаратуры. - М.: Додека XXI век, 2002. - 576 с.
112. ПЛИС фирмы «Xilinx»: описание структуры основных семейств / Д.А. Кнышев, М.О. Кузелин. - М.: Додэка, 2001. - 238 с.
113. Максфилд К. Проектирование на ПЛИС. Курс молодого бойца. -М.: Издательский дом «Додэка-ХХ1», 2007. - 408 с.
114. DSP or FPGA? How to choose the right device. - Режим доступа: http://www.design-reuse.com/articles/! 8212/dsp-fpga.html
115. Цифровая обработка сигналов: Справочник / JT.M. Гольденберг, Б.Д. Матюшкин, М.Н. Поляк. -М.: Радио и связь, 1985. - 312 с.
116. 754-2008 IEEE Standard for Floating-Point Arithmetic. - Режим доступа: http://ieeexplore.ieee.org/servlet/opac?punumber=4610933
117. IEEE Standard 754 Floating Point Numbers. - Режим доступа: http://steve.hollasch.net/cgindex/coding/ieeefloat.html
118. Ануфриев И.Е. MATLAB 7 / И.Е.Ануфриев, А.Б.Смирнов, Е.Н. Смирнова. - СПб.: БХВ-Петербург, 2005. - 1104 с.
119. Сайт компании Mathworks. - Режим доступа: http:// www. mathworks .com/
120. Оценка производительности вычислительных систем. - Режим доступа: http://www.citforum.ru/hardware/svk/glava_3.shtml
121. ADSP-TS201S TigerSHARC Embedded Processor. - Режим доступа: http://www.analog.com/static/imported-files/data_sheets/ADSP_TS201 S.pdf
122. LVDS Owner's Manual. - Режим доступа: http://www.national.com/appinfo/lvds/files/National_LVDS_Owners_Ma nual_4th_Edition_2008 .pdf
123. TMS320C6745/6747 Floating-point Digital Signal Processor. - Режим доступа: http://focus.ti.com/lit/ds/symlink/tms320c6747.pdf
124. TMS320C6457 DSP Serial RapidIO (SRIO) User's Guide. - Режим доступа: http://focus.ti.com/lit/ug/sprugk4/sprugk4.pdf
125. Сайт компании Texas Instruments. - Режим доступа: http://www.ti.com/
126. http://www.rapidio.com/
ПРИЛОЖЕНИЕ А СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ
АББРЕВИАТУР
И
<р(х,у) х и У
Фт'Уп)
N М
К Gu
G„
P(Y) Y
YH
Pt(Y) a,
A A
5
B{ju,v)
H V
5
h
двумерная функция амплитуды точек яркости изображения координаты точек на плоскости
значение интенсивности или уровень яркости точки цифрового изображения
ширина изображения
высота изображения
максимальный уровень яркости
гистограмма изображения
нормированная гистограмма
ширина дифференциального коридора (шага) гистограммы
номер интервала гистограммной оценки число интервалов гистограммной оценки модель в виде многокомпонентного распределения амплитуда яркости точек обрабатываемого изображения
нормированная к максимальному значению Lm амплитуда яркости точек обрабатываемого изображения
ФПВ отдельной компоненты
вес соответствующей компоненты pt (7)
моменты распределений
коэффициенты определения принадлежности ФПВ к определенному типу распределения
бета функция
параметры бета-распределения
центральное значение уровня яркости к -го интервала гистограммной оценки
ФР амплитуд точек яркости отдельной компоненты
к
Яу £
т
Я.
стр:
Я
Ъстр
0)пр,рад
ЯдК)
Щ,)
р.,
К
^исх
Мш Аш
Мг ш
ГДм,у) к (х,у,и,у)
Ф) Ф)
Ж; Ж' при I -
весовой множитель
вектор оптимизируемых параметров при аппроксимации ПАКФ
теоретическая ПАКФ сдвиг в пикселях по высоте изображения сдвиг в пикселях по ширине изображения АКФ отдельной строки изображения
усредненная по столбцам ПАКФ
функции отличия эмпирической ПАКФ от аппроксимирующей
пространственная частота
спектр функции отличия эмпирической ПАКФ от аппроксимирующей
функция градационного преобразования вероятность появления амплитуды У,
зашумленное изображение исходное изображение
аддитивные внешние шумы мультипликативные внешние шумы аддитивные шумы системы регистрации мультипликативные шумы системы регистрации коэффициенты ДП оператор прямого преобразования оператор обратного преобразования вспомогательные функции коэффициенты ВПР
h £
n J| à>n
^воет
dwt[...]
?
idwt[...]
Ed
d TS
СЖ
A,
Г„М
Pi
CM
ç(t) PK
H{jœ)
FQ{jco)
m{.}
I
MPEG
■ MPEG
В
MPEG
DC
MPEG
коэффициенты низкочастотного и высокочастотного фильтров ВПР соответственно
восстановленное изображение оператор прямого и обратного ВПР
порог энергии обнуления уровень энергии в % коэффициент сжатия
порог, определяющий уровень качества сжатого изображения КФ СП
собственные числа
базисная функция в разложении Карунена-Лоева
скейлинг функция
вейвлет-функция
спектр вейвлет-функии
динамический диапазон кп
передаточная функция вейвлет-фильтра
преобразование Фурье исходного сигнала
СКО коэффициентов ВПР
математическое ожидание
кадры, сжатые независимо от других кадров
кадры, сжатые с использованием ссылки только на одно изображение
кадры, сжатые с использованием ссылки на два изображения;
кадры, независимо сжатые с большой потерей качества (используются только при быстром поиске в видеопотоке).
АКФ автокорреляционная функция
ВПР вейвлет-пакетное разложение
ВЧ высокочастотных
ДИХ двумерная импульсная характеристика
дкп дискретное косинусное преобразование
дп декоррелирующее преобразование
ДПФ дискретное преобразование Фурье
кп корреляционный предсказатель
КФ корреляционная функция
ЛА летательный аппарат
НЧ низкочастотных
ПАКФ пространственная автокорреляционная функция
ПОСШ пиковое отношение сигнал-шум
ско среднеквадратическое отклонение
СП случайный процесс
спм спектральная плотность мощности
ФПВ функция плотности вероятности
ФР Функция распределения
ПРИЛОЖЕНИЕ В КОПИИ АКТОВ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ
- ., «УТВЕРЖДАЮ» Заместитель генерального директора -reiiepapBHpjfty конструктора
f/it<y - _Н.П. Колесников
2007 г.
АКТ
о реализации результатов диссертационной работы аспиранта Рязанского государственного радиотехнического университета Косткина Ивана Вячеславовича в ФГУП «Российский научно-исследовательский институт космического
приборостроения»
Комиссия в составе: председателя комиссии:
- заместителя генерального конструктора, начальника отделения, доктора технических наук A.B. Круглова,
членов комиссии:
- заместителя начальника отделения, кандидата технических наук, старшего научного сотрудника В.М. Ватутина,
- начальника группы Ю.И. Полтавца
составила настоящий акт о том, что в ФГУП «РНИИ КП» реализованы следующие результаты диссертационной работы Косткина И.В.:
1. Алгоритм сжатия видеопоследовательности для визуального контроля управляемыми космическими аппаратами на основе вей влет-пакетного разложения и разностного кодирования;
2. Быстрые алгоритмы обработки информации на основе вейвлет-пакетного разложения и разностного кодирования.
Результаты диссертационной работы Косткина И.В. реализованы при передаче видеопотока со скоростью 256 кбит/с в командно-измерительных системах (КИС) НКУ КА «KazSat» и КИС «Клен-Р». Применение вышеперечисленных результатов исследований Косткина И.В. позволило обеспечить работу аппаратуры визуального контроля функционирования КА «KazSat» в реальном масштабе времени и повысить оперативность обработки информации на 10 %.
Заместитель генерального конструктора, ,,
начальник отделения, д.т.н. •'' А.В.Круглое
у' X Г
Заместитель начальника отделения, к.т.н., с.н.с. - В.М. Ватутин
/
Начальник группы -П Ю.И. Полтавец
« У'| верждаю »
Проректор по учебной работе Рязанрсоц) 1 ос> дарственного рад ¡¡^ с хин кед о > ниверситета
' N¡1 • в.} 1у б ко в
Ч< » ; у
201 I Г.
АКТ
//
о внедрении результатов диссертационной работы аспиранта Рязанского государственного радиотехнического у ни верситета
Косткина Ивана Вячеславовича в учебный процесс Рязанского государственного радиотехнического университета (ФГБОУ ВПО «РГРТУ»)
Настоящий акт составлен в том, что результаты диссертационной работы Косткина И.В, в виде:
1) Алгоритмов сжатия видео данных на основе вейвлет-пакетного разложения с оптимальной базисной системой на каждом уровне и математической модели предсказания вектора движения.
2) Метода улучшения визуального качества цифровых снимков на основе статистической модели амплитуд точек яркости.
применяются в учебном процессе ФГБОУ ВПО «РГРТУ» в лекционных курсах «Кодеки сигналов в МТКС» и «Системы коммутации сетей подвижной радиосвязи» по специальностям: 201000 «Многоканальные телекоммуникационные системы» и 201200 «Средства связи с подвижными объектами».
Зав. кафедрой РУС
Декан ФР Г
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.