Проекционный метод решения некоторых задач обработки и анализа изображений тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат физико-математических наук Наджафи, Мохсен Мохаммадали
- Специальность ВАК РФ05.13.18
- Количество страниц 110
Оглавление диссертации кандидат физико-математических наук Наджафи, Мохсен Мохаммадали
Введение.
Глава 1. Проекционный метод обработки изображений.
Глава 2. Проекционный метод подавления блочного эффекта
2.1. Блочный эффект при сжатии изображений.
2.1.1. Сжатие Изображений.
2.1.2. Существующие методы подавления блочного эффекта. а. Встроенная выходная обработка (Embedded post-processing) для улучшения сжатых изображений. б. Проективная пространственная адаптивная реконструкция блочно-компрессированных изображений.
2.2. Анализ возникновения блочного эффекта.
2.3. Разработанные алгоритмы подавления блочного эффекта. а. Подавление блочного эффекта за счет усреднения энергий блоков. б. Применение проекционного метода для подавления блочного эффекта в. Метод подавления блочного эффекта использующий проекционный метод и метод усреднения энергий. г. Метод оценивания величины блочного эффекта.
Стандартный метод оценивания величины блочного эффекта.
Предложенный метод оценивания величины блочного эффекта.
Глава 3. Проекционный метод нахождения границ изображений
3.1 Модель границы изображения.
3.2.Фильтрация изображений с использованием функций Эрмита.
3.3. Проекционный метод дифференцирования функции интенсивности
3.4. Методы выделения границ и результаты расчетов.
Глава 4. Программный комплекс, реализующий проекционный метод обработки изображений.
4.1. Общие программы проекционного метода.
4.1.1. Общая структура и программы проекционного метода.
4.1.2.0писание основных функций реализующих проекционный метод.
4.2. Программная реализация проекционного метода подавления блочного эффекта.
4.2.1. Общая структура и программы проекционного метода подавления блочного эффекта.
4.2.2. Описание основных функций реализующих проекционный метод подавления блочного эффекта.
4.3. Программная реализация проекционного метода нахождения границ изображений.
4.3.1. Общая структура и программы проекционного метода нахождения границ изображений.
4.3.2. Описание основных функций реализующих проекционный метод нахождения границ изображений.
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Быстрый проекционный метод обработки мультимедиа информации2005 год, кандидат физико-математических наук Корчагин, Данил Николаевич
Регуляризирующие методы фильтрации и восстановления изображений2008 год, кандидат физико-математических наук Цибанов, Владимир Николаевич
Программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями2006 год, кандидат технических наук Дегтярева, Ольга Александровна
Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах2008 год, кандидат технических наук Бабаян, Александр Вигенович
Математическое моделирование и компьютерный анализ жидких металлических систем2009 год, доктор физико-математических наук Крылов, Андрей Серджевич
Введение диссертации (часть автореферата) на тему «Проекционный метод решения некоторых задач обработки и анализа изображений»
Интенсивное развитие компьютерных технологий неразрывно связано с разработкой новых методов обработки и анализа мультимедийной информации. Важное значение имеют методы обработки изображений, такие как нахождение границ объектов, ориентированные на последующий анализ изображений. В то же время, большой интерес представляют методы, позволяющие решать задачи обработки информации, подвергшейся компрессии с потерями. Одной из таких задач, привлекающей в настоящее время большое внимание, является задача подавления блочного эффекта, возникающего при компрессии изображений. Необходимо отметить, что решение подобных задач требует использования методов математического моделирования, разработки соответствующих эффективных численных методов и комплексов программ.
Одним из наиболее эффективных подходов к решению задач обработки изображений является использование Фурье анализа. С другой стороны, использование спектральных методов, основанных на нестандартной параметризации изображений и сигналов, позволяет повысить качество процедуры обработки изображений. Важным направлением исследований, использующим оба этих подхода, является частотно-временная фильтрация сигналов, использующая базисы функций, локализованных одновременно как в частотном, так и во временном пространствах.
В связи с этим, развитие частотно-временных методов обработки изображений, решение на их основе задач подавления блочного эффекта на компрессированных изображениях и построения устойчивого к шуму метода нахождения границ зашумленных изображений представляет собой важную и актуальную задачу.
Цель Диссертационной работы
Целью диссертационной работы является построение, основанных на применении проекционного метода обращения преобразования Фурье, численных методов и разработка программного обеспечения для анализа и подавления блочного эффекта для компрессированных изображений и выделения границ зашумленных изображений.
Научная новизна работы
• разработан метод устранения блочного эффекта, возникающего при компрессии изображений, основанный на комбинации проекционного алгоритма и процедуры усреднения.
• Создана новая метрика для анализа блочного эффекта на изображениях.
• разработан проекционный метод для выделения границ зашумленных изображений.
Теоретическая и практическая значимость работы
• проведен сравнительный анализ эффективности предложенного проекционного метода выделения границ зашумленных изображений и метода, основанного на использовании дискретного преобразования Фурье.
• разработанные в работе проекционные методы могут быть применены как составная часть комплексных алгоритмов обработки и анализа изображений.
• создан программный комплекс для анализа блочного эффекта и его подавления для компрессированных изображений и выделения границ зашумленных изображений.
Апробация работы
Основные результаты диссертации докладывались на
1. Международной конференции "Graphicon 2003", г. Москва.
2. \2'h Iranian Researchers Conference in Europe UMIST, Manchester, United Kingdom, July 2004.
3. Научно-исследовательском семинаре кафедры математической физики факультета ВМК МГУ им. М.В. Ломоносова, 2004 г.
Содержание работы
Первая глава посвящена применению проекционного метода обращения преобразования Фурье для обработки изображений. Проекционный метод обработки изображений основан на использовании разложения функции интенсивности изображения в ряд Фурье по полной в Ь2 (-оо,+оо) ортонормированной системе функций Чебышева-Эрмита, являющихся собственными функциями преобразования Фурье.
Каждая из функций Чебышева-Эрмита локализована с вычислительной точки зрения на конечном отрезке и разложение функции интенсивности в ряд ведется на интервале соответствующем выбранному числу членов разложения. В работе разработаны численный метод нахождения области локализации функций Чебышева-Эрмита, метод аппроксимации двухмерной функции интенсивности на основе одномерного проекционного метода и метод нормирования функций Чебышева-Эрмита, сохраняющий общую энергию изображения. Показана близость изображений, полученных проекционным методом и методом, основанном на разложении в тригонометрический ряд Фурье при одинаковом числе членов разложения. Предложены методы подавления эффекта Гиббса, возникающего при применении проекционного метода.
Вторая глава посвящена разработке метода подавления блочного эффекта на изображениях, использующего проекционный метод и метод усреднения энергий блоков.
В разделе 2.1.1. описаны схемы сжатия изображений, включающие в себя получение коэффициентов линейного преобразования (например, коэффициентов дискретного преобразования Фурье для JPEG-компрессии), разбиение изображения на блоки, и кодирование для передачи по каналу связи. Описывается эффект блочности, возникающий при независимой обработке неперекрывающихся блоков и выражающийся в резком изменении интенсивности на границах блоков изображения.
В разделе 2.1.2 рассмотрены существующие методы подавления блочного эффекта, которые можно разделить на две основные группы: методы, использующие информацию о методе кодирования для реконструкции границы блока и не использующие такой информации. Описаны методы встроенной выходной обработки и проективной пространственной адаптивной реконструкции.
Раздел 2.2. посвящен анализу возникновения блочного эффекта на изображениях при компрессии. На примере JPEG-компрессии рассмотрены основные параметры, влияющие на возникновение блочного эффекта: массив квантования; количество рассматриваемых коэффициентов линейного преобразования, размеры блоков. Показано, что при достаточно большой ошибке квантования коэффициентов линейного преобразования, она становится коррелированной с коэффициентами преобразования и является основным источником возникновения блочного эффекта, нарушающим, в том числе, баланс энергии между блоками изображения. На основе проведенного анализа изображение разделяется на две составляющие: часть, содержащую информацию об интенсивности блоков, и часть, содержащую информацию о деталях изображения. Ставится задача подавления блочного эффекта, включающая в себя усиление контуров объектов внутри блока и сглаживание границ между блоками, т.е. устранение блочности без сильного уменьшения детальности каждого блока.
В разделе 2.3 поставленная задача подавления блочного эффекта решается с помощью методов, основанных на использовании метода усреднения энергий блоков в низкочастотной области изображения и проекционного метода, ориентированного на обработку высокочастотной области.
Алгоритм усреднения энергий блоков включает в себя вычисление энергии для каждого блока и автоматическое выделение блоков, для которых будет проводиться усреднение. Если разность энергии между данным и соседним блоком меньше порога, то этот соседний блок участвует в усреднении и энергия рассматриваемого блока перенормируется .
Для подавления блочного эффекта в высокочастотных областях в работе используется проекционный метод. В рамках проекционного метода, проводится аппроксимация всего изображения с использованием разложения функции интенсивности в ряд по функциям Эрмита. Показано, что метод полной замены изображения его аппроксимацией проекционным методом дает результаты близкие результатам метода, использующего аппроксимацию информации только по строкам и столбцам, примыкающим к границам блоков. Используя метрику PSNR, проведено сравнение результатов подавления блочного эффекта для стандартного тестового изображения с существующими методами, использующими информацию о положении границ блоков, показавшее эффективность проекционного метода. Естественное объединение предложенных двух методов позволило построить эффективный метод подавления блочного эффекта для всего изображения. При этом рассматривалось как применение проекционного метода после метода усреднения энергий блоков, так и использование этих методов в обратной последовательности. Было показано, что первый вариант является более пре дпо чтител ьны м.
Использование метрики PSNR для оценки эффекта подавления блочного эффекта недостаточно эффективно. Это объясняется, в том числе тем, что этот метод не ориентирован на анализ информации на границах блоков. В данной работе предложена новая метрика оценка блочного эффекта на изображениях, и проведено ее сравнение с существующим методом оценки блочности. Предложенная метрика показала для всех случаев наилучшее соответствие результатам визуального анализа.
Третья глава посвящена разработке метода выделения границ зашумленных изображений на основе проекционного метода.
В разделе 3.1 рассматриваются основные концепции, используемые при-построении моделей границы изображения. Все эти модели, в той или иной форме, требуют для нахождения границ решения задачи сглаживания исходной информации и анализа полученных производных различного порядка.
В разделе 3.2 исследовано влияние фильтрации изображений на результаты выделения границ изображений. Рассмотрены подходы, основанные на проекционным методе и методе, использующем разложение функции интенсивности в тригонометрический ряд Фурье.
В разделе 3.3 разработан и проанализирован метод численного дифференцирования функции интенсивности изображений на основе проекционного метода.
Задача дифференцирования некорректна в рассматриваемом пространстве
С"00»00), однако характер изменения ошибки в коэффициентах разложения проекционного метода существенно отличается от изменения коэффициентов при использовании разложения в ряд по тригонометрической системе функций: Возрастание ошибки в коэффициентах разложения производных существенно медленнее у предложенного проекционного метода, чем и объясняется эффективность этого подхода, как для получения, так и для анализа областей максимумов и нулей производных, необходимых для построения методов выделения границ изображений, в сравнении с использованием тригонометрического ряда Фурье. Одновременная вычислительная локализация функций Эрмита, по базису из которых осуществляется аппроксимация функции интенсивности изображения, и их преобразований Фурье позволяет достаточно устойчиво определять особенности производных интенсивности.
В разделе 3.4 на основе проекционного метода численного дифференцирования функции интенсивности строятся методы выделения границ зашумленных изображений, основанные на использовании различных вариантов пороговых критериев.
Сравнение получающихся результатов метода выделения границ для проекционного метода, и метода с использованием разложения в тригонометрический ряд Фурье показало эффективность предлагаемого метода. Результаты анализа с использованием различных пороговых критериев показывают, что
А) При фиксировании величины порога а. Число ложных найденных точек для метода, основанного на ряде Фурье больше, чем число найденных точек для метода, основанного на использовании разложения по функциям Эрмита. б. Величина полученного PSNR, как функция от числа используемых членов разложения, больше и является более гладкой для случая разложения по функциям Эрмита.
Б) При фиксировании числа членов разложения а. Число ложных найденных точек для метода, основанного на ряде Фурье, убывает медленнее, чем число найденных точек для метода, основанного на использовании разложения по функциям Эрмита. б. В области, где методы дают значимое число найденных точек (порог меньше 15%), величина полученного PSNR, как функция от величины порога, больше и растет быстрее для случая разложения по функциям Эрмита.
Четвертая глава посвящена описанию, созданного на основе предложенных методов, программного комплекса обработки изображений для анализа и подавления блочного эффекта для компрессированных изображений и выделения границ зашумленных изображений с использованием средств пакета MATLAB. В заключении сформулированы основные результаты диссертации.
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Обработка изображений двумерными нерекурсивными цифровыми фильтрами2010 год, доктор технических наук Приоров, Андрей Леонидович
Разработка и исследование методов анализа и обработки графической информации в условиях неопределенности2000 год, кандидат технических наук Андонова, Наталья Сергеевна
Многомасштабные методы синтеза и анализа изображений2002 год, кандидат физико-математических наук Переберин, Антон Валерьевич
Анализ и восстановление изображений проекционными методами, использующими функции Эрмита2015 год, кандидат наук Павельева, Елена Александровна
Разработка алгоритмов стабилизации и компрессии изображений для систем видеонаблюдения мобильных робототехнических комплексов2008 год, кандидат физико-математических наук Коплович, Евгения Александровна
Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Наджафи, Мохсен Мохаммадали
Результаты работы этих функций приведены на рис. 4.
Рис. 4.20. Первые (верхний ряд) и вторые производные (нижний ряд) полученные при использовании разложения по функциям Эрмита (слева) и в тригонометрический ряд Фурье (справа).
Базовыми программами данного алгоритма являются функции реализующие пороговые критерии du, dl, d2, d2 dL,dld2 Пример применения выделения границ изображения для одной из пороговых функций, приведен на рис. 4.21 (пороговый уровень был взят одинаковым для разложений вряд по функциям Эрмита и в тригонометрический ряд Фурье).
Рис. 4.21 Результаты выделения границ незашумленного изображения при использовании разложения в тригонометрический ряд Фурье (слева); по функциям Эрмита (средний рисунок); исходное изображение (справа).
Заключение
В результате написания диссертационной работы были получены следующие основные результаты:
1 .Предложен и разработан метод устранения блочного эффекта, возникающего при компрессии изображений, основанный на комбинации проекционного алгоритма и процедуры усреднения.
2.Построен проекционный алгоритм выделения границ изображений, ориентированный на решение задачи выделения границ зашумленных изображений.
3.Разработан комплекс программ обработки изображений для анализа блочного эффекта и его подавления для компрессированных изображений и выделения границ зашумленных изображений.
Предложенные в работе методы показали хорошие результаты при обработке и анализе изображений, и расширение области их применимости, например для обработки видеоинформации, и их дальнейшее развитие представляются достаточно перспективными.
Список литературы диссертационного исследования кандидат физико-математических наук Наджафи, Мохсен Мохаммадали, 2004 год
1. П.К. Суэтин, "Классические ортогональные многочлены", Изд-во Наука, Москва, 1976.
2. Г. Сеге, "Ортогональные многочлены", М. Физматгиз, 1962.
3. А.С. Крылов, А.В .Лякишев, "Неравенство для норм функций Эрмита на конечном интервале", Вестн. Моек Ун-та, сер. 15, Вычисл. Матем. Киберн., N1, С. 17-19, 1999.
4. В.И. Крылов, Л.Г. Кругликова, "Справочная книга по численному гармоническому анализу ", Минск, Изд-во Наука и техника, 1968.
5. A.S. Krylov, A.V. Liakishev, "Numerical Projection Method for Inverse Fourier Transform and It Application", Numerical Functional Analysis & Optimization, vol.21, issues 1&2, pp. 205-216, 2000.
6. A. Krylov, D. Kortchagine, "Projection filtering in image processing", Graphicon'2000 Conference proceedings, pp. 42-45, 2000.
7. Jean-Bernard Martens, "The Hermite Transform Theory", IEEE Trans, on Acoustics, Speech and Signal Processing, vol. 38, pp. 1595-1606, 1990.
8. Jean-Bernard Martens, "The Hermite Transform Applications", IEEE Trans, on Acoustics, Speech and Signal Processing, vol. 38, pp. 1607-1618, 1990.
9. Д. Ватолин, А. Ратушняк, M. Смирнов, В. Юкин, "Методы сжатия данных", Изд-во Диалог-МИФИ, 2002.
10. С. Уэлстид, " Фракталы и вейвлеты для сжатия изображений в действии Изд-во Триумф, 2003.
11. Дж. Миано, " Форматы и алгоритмы сжатия изображений в действии ", Изд-во Триумф, 2003.
12. G. К. Wallace, "The JPEG still-picture compression standard", Communications of the ACM, vol. 34, p. 30-44, April 1991.
13. G. Fan, W. Kuen Cham, "Model Based Edge Reconstruction for Low Bit-Rate Wavelet-Compressed Images", IEEE Trans. On Circuits and Systems For Video Technology.vol. 10, No.l, pp. 120-132, February 2000.
14. H. G. Wu, Т. Chen and В. Qiu, "Adaptive postflltering of transform coefficients for the reduction of blocking artifacts," IEEE Trans, on Circuits and Systems for Video Technology, vol. 11, p. 584-602, May 2001.
15. A. Nosratina, "Embedded postprocessing of compressed images," Proc. Data Compression Conference, p. 62-71, 1999.
16. Ana Nosratina, "Postprocessing of JPEG-2000 Images to Remove Compression Artifacts", IEEE Signal Processing Letters, N. V, vol. XX, pp. 296-299, 2002.
17. J.Chou, M. Crouse, and K. Ramchandran, "A Simple Algorithm For Removing Blocking Artifacts In Block-Transform Coded Images", IEEE Signal Processing Letter, Vol.5, pp.33-35, February 1998.
18. Yongui Yang, Nicolas Galatsanos, Aggelo K. Katsaggelos, " Projection-Based Spatially-Adaptive Reconstruction of Block Transform Compressed Image", IEEE Transactions on Image processing, vol. 4, No. 7, pp. 896-908, July 1996.
19. Bahadir K. Gunturk, Yucel Alyunbasak, Russel M. Mersereau. "Multiframe В locking-Artifact Reduction for Transform Coded Video", IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, issue 4, pp. 267-282, Apr. 2002.
20. Younghooi Hwang, Byeungwoo Jeon, Sanghool Sull, "Post Processing for Reducing Blocking Artifacts using Adaptive Low-Pass Filtering", Proc. Of ITC-CSCC2002, pp.297-300, July 2002.
21. Roberto Castango, Giovanni Ramponi, "A Rational Filter for the Removal of Deblocking Artifact in Image Sequences at Low Bitrate", Proc. of EUSIPco'96', vol. I, pp. 567-570, Sept. 1996.
22. Roberto Castango, Stefano Marsi, Giovanni Ramponi, "A Simple Algorithm For The Reduction of Blocking Artifacts in Image and Implementation", IEEE Trans. On Consumer Electronics, vol.44, No.3, pp. 1062-1070, Aug. 1998.
23. T. Meier, King N. Ngan, Greg Gerbin, "Reduction Of Coding Artifacts at Low Bitrates", SPIE International Conference on Communications and Image Processing, San Jose, U.S.A., pp 241-251, February 1998.
24. Xiaoyan Sun, Feng Wu, Shipeng Li," In-Loop Deblocking Filter for Block-Based Video Coding", ICSP 2002,vol. 1, pp. 33-36,2002.
25. Zixiang Xiong, Michel T.Orchand, Ya Qin Zhang, " Deblocking Algorithm for JPEG Compressed Images Using Overcomplete Wavelet Reconstruction", IEEE Transaction. On Circuit and System for Video Technology, v.7, pp. 433-437, 1996.
26. R.A.Gopinath, M.Lang, H.Guo, J.E.Odegam, "Wavelet-Based Post processing of Low Bitrate Transform coded images", In Proc. of Intl. Conf. In Image Processing, v. II, Austin TX, pp. 913-917, November 1994.
27. Д. Ватолин, С. Гришин, " Качественный метод деблокинга видео без использования информации о квантовании ", Graphicon'2004Conference proceedings, рр.257-262, 2004.
28. A.V. Oppenheim, R.W. Schafer, "Digital Signal Processing", Prentice-Hall, 1975.
29. David A. Forsyth, Jean Ponce, "Computer Vision A Modern Approach" Prentice Hall, 2003.
30. Mike Heath, Sudeep Sakar, Thomas Sanocki, Kevin Bowyer, "Comparison of Edge Detectors", Computer Vision And Image Understanding, Vol.69, No.l, January, pp. 3854, 1998.
31. D. Ziou, S. Tabbone "Edge detection techniques-an overview", Int. J. of Pattern Recognition and Image Analysis, Vol. 8, No. 4, pp. 537-559, 1998.
32. D. Marr, E. Hildreth "Theory of edge detection", Proceedings of the Royal society of London, Series B, Vol. 207, pp 187-217,1980.
33. J. Canny "A Computational approach to edge detection", IEEE Transactions on pattern analysis and machine intelligence. Vol. 8, No. 6, pp. 679-698, 1986.
34. Earl Gose, Richard Johnsonbaugh, Steve Jost, "Pattern Recognition And Image Analysis", Prentice Hall, 1996.
35. A.H. Тихонов, В.Л. Арсенин, "Методы решения некорректных задач", М.: Наука, 1979.
36. В.Д. Дьяконов, "MATLAB 6/6.1/6.5 + SIMULINK 4/5 Основные применения", Москва, СОЛОН- Пресс, 2002.
37. В. Говорухин, В. Цибулин, " Компьютер в математическом исследовании Maple, Matlab, Latex", ПИТЕР, 2001.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.