Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат технических наук Голубев, Максим Николаевич
- Специальность ВАК РФ05.12.04
- Количество страниц 206
Оглавление диссертации кандидат технических наук Голубев, Максим Николаевич
ВВЕДЕНИЕ.
1. АЛГОРИТМЫ ДЕТЕКТИРОВАНИЯ ЛИЦ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ.
1.1. Классификация методов.
1.2. Методы, основанные на знаниях.
1.3. Методы на основе инвариантных свойств.
1.3.1. Признаки лица.
1.3.2. Текстура.
1.3.3. Сочетание признаков.
1.4. Методы на основе сравнения с шаблоном.
1.4.1. Предопределенные шаблоны.
1.4.2. Деформируемые шаблоны.
1.5. Методы на основе обучения.
1.5.1. Собственные лица.
1.5.2. Методы на основе вероятностных распределений.
1.5.3. Нейронные сети.
1.5.4. Наивный байесовский классификатор.
1.5.5. Скрытые марковские модели.
1.5.6. Теоретико-информационный подход.
1.5.7. Индуктивное обучение.
1.5.8. Бустинг.
1.5.9. Разреженная сеть просеивающих элементов.
1.5.10. Машина опорных векторов.
1.6. Тестовая база изображений.
1.7. Сравнительный анализ алгоритмов на основе обучения.
1.8. Краткие выводы.
2. АНАЛИЗ АЛГОРИТМОВ ВЫДЕЛЕНИЯ ЛИЦ В УСЛОВИЯХ ИСКАЖЕНИЙ.
2.1. Вводные замечания.
2.2. Модели искажений.
2.2.1. Гауссов шум.
2.2.2. Импульсный шум.
2.2.3. Импульсный шум в цветных изображениях.
2.3. Описание фильтров.
2.3.1. Фильтры для удаления гауссова шума.
2.3.2. Фильтры для удаления импульсного шума.
2.4. Анализ работы алгоритмов в условиях наличия искажений на изображениях.
2.5. Фильтрация зашумленных изображений
2.6. Краткие выводы.
3. ПОСТОБРАБОТКА ВЫДЕЛЕННЫХ ОБЛАСТЕЙ С ЦЕЛЬЮ ФИЛЬТРАЦИИ ЛОЖНЫХ СРАБАТЫВАНИЙ.
3.1. Использование информации о цвете.
3.2. Подходы к детектированию пикселей кожи на изображениях.
3.2.1. Явное определение кластера кожи.
3.2.2. Непараметрические модели распределения оттенков кожи.
3.2.3. Параметрические модели распределения оттенков кожи.
3.3. Фильтрация ложных срабатываний на основе детектора кожи.
3.3.1. Алгоритм 1: Явное задание кластера кожи.
3.3.2. Алгоритм 2: Непараметрическая модель кожи.
3.3.3. Результаты моделирования.
3.4. Использование детектора кожи для лиц людей различных рас.
3.5. Краткие выводы.
4. ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ К ЗАДАЧЕ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ПОЛА ЛЮДЕЙ ПО ИЗОБРАЖЕНИЮ ЛИЦА.
4.1. Вводные замечания.
4.2. Описание алгоритмов.
4.2.1. Линейный дискриминантный анализ.
4.2.2. Метод опорных векторов.
4.2.3. Предлагаемый алгоритм.
4.3. Методика тестирования.
4.4. Результаты тестирования.
4.5. Краткие выводы.
5. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ В СРЕДЕ RECOGNITION.LAB.
5.1. Вводные замечания.
5.2. Интерфейс программы.
5.2.1. Основное окно.
5.2.2. Панель управления.
5.2.3. Окно параметров.
5.3. Особенности представления алгоритмов в среде Recognition.Lab.
5.3.1. Изображение.
5.3.2. Алгоритмы детектирования.
5.3.3. Параметры детектирования.
5.4. Процедура добавления нового объекта детектирования.
5.4.1. Обучающая база.
5.4.2. Обучение каскада.
5.4.3. Добавление объекта в Recognition.Lab.
5.5. Краткие выводы.
Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Разработка и анализ алгоритмов распознавания лиц на телевизионных изображениях для биометрической идентификации2014 год, кандидат наук Шмаглит, Лев Александрович
Разработка и анализ нелинейных алгоритмов подавления импульсного шума в полутоновых и цветных изображениях2011 год, кандидат технических наук Куйкин, Денис Константинович
Удаление шума из изображений нелинейными цифровыми фильтрами на основе ранговой статистики2007 год, кандидат технических наук Бухтояров, Сергей Сергеевич
Разработка и исследование алгоритмов распознавания изображений на основе определения экстремальных признаков замкнутых контуров с помощью сортировки2008 год, кандидат технических наук Рюмин, Олег Германович
Сопровождение и распознавание объектов на телевизионных изображениях2013 год, кандидат технических наук Ганин, Александр Николаевич
Введение диссертации (часть автореферата) на тему «Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения»
Актуальность темы
Современный уровень научно-технического развития требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является проблема автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия [1-21].
Первые работы в области теории распознавания и классификации появились в 30-х годах прошлого столетия и были связаны с байесовской теорией принятия решений (работы Неймана Дж., Пирсона Э. [22]), применением разделяющих функций к задаче классификации (Фишер Р. [23]), решением вопросов проверки гипотез (Вальд А. [24]). В 50-х годах появились первые нейросетевые модели распознавания (перцептрон Розенблата Ф. [25]), связанные с успехами в моделировании головного мозга. К концу 60-х годов уже были разработаны и детально исследованы различные подходы для решения задач распознавания в рамках статистических, перцептронных моделей и моделей с разделяющими функциями. Итоги данных и последующих исследований были представлены в ряде монографий [25-39, 10, 20]. Большой вклад в развитие теории распознавания и классификации внесли советские и в последующем российские ученые: Айзерман М.А., Браверман Э.М., Розоноэр Л.И. (метод потенциальных функций [27]), Вапник В.Н., Червоненкис А.Я. (статистическая теория распознавания, метод «обобщенный портрет» [10]), Мазуров В.Д. (метод комитетов [40-41, 33]), Ивахненко А.Г. (метод группового учета аргументов [31]), Загоруйко Н.Г. (алгоритмы таксономии и анализа знаний [29, 30]), Лбов Г.С. (логические методы распознавания и поиска зависимостей [32]). Интенсивные исследования проводились с конца 60-х годов в ВЦ АН СССР (в настоящее время ВЦ им. A.A. Дородницына РАН). Еще в начале 60-х академиком РАН Журавлевым Ю.И. был предложен тестовый алгоритм распознавания - логический метод эффективного решения задач распознавания при малом числе обучающих прецедентов [42]. В дальнейшем на базе этого алгоритма Журавлевым был построен новый класс распознающих процедур - алгоритмы вычисления оценок [43], а затем введена и исследована алгебраическая теория распознавания [21, 44]. В этом направлении фундаментальные результаты получили также чл. корр. РАН Рудаков К.В. (общая теория проблемно-ориентированного алгебраического синтеза корректных алгоритмов [45]), чл. корр. РАН Матросов B.JI. (статистическое обоснование алгебраического подхода [46]), Рязанов В.В. (оптимизация моделей классификации [47], коллективные решения задач кластерного анализа [48-49]), ДюковаЕ.В. (асимптотически-оптимальные логические алгоритмы [50,51]), Сенько О.В. (алгоритмы взвешенного статистического распознавания [52]), Асланян JI.A. (логические алгоритмы распознавания [53]), Донской В.И. (решающие деревья [54-55]) и многие другие исследователи России, СНГ и дальнего зарубежья.
В последние годы появились узкоспециализированные системы интеллектуального анализа данных. Для данных систем часто характерна ориентация на узкий круг практических задач, а их алгоритмической основой является какая-либо одна из альтернативных моделей, использующая нейронную сеть, решающие деревья, ограниченный перебор и т.п. [56]. Между тем на настоящем уровне развития методов решения задач анализа данных и распознавания представляется предпочтительным путь создания программных средств, включающих основные существующие разнообразные подходы. В данном случае повышаются шансы подбора из имеющихся алгоритмов такого алгоритма, который обеспечит наиболее точное решение интересующих пользователя задач на новых данных. Другим важным атрибутом систем анализа и классификации должно быть наличие средств автоматического решения задач распознавания и классификации коллективами алгоритмов. Действительно, стандартной ситуацией является наличие нескольких альтернативных алгоритмов или решений, равнозначных для пользователя. Для выбора из них одного наиболее предпочтительного не хватает информации. Тогда естественной альтернативой выбору является создание на базе имеющихся алгоритмов или решений новых, более предпочтительных.
Теоретические основы практической реализации идеи решения задач анализа данных коллективами алгоритмов были разработаны в ВЦ РАН для решения задач распознавания (логическая и алгебраическая коррекция алгоритмов) в 1976-1980 гг. [20,21,44] и комитетного синтеза классификаций для задач кластерного анализа (автоматической классификации) в 1981-1982 годах [48, 49]. Позднее появились исследования в данной области и в других странах.
При таком подходе новые алгоритмы распознавания строятся в виде полиномов над исходными алгоритмами (применение алгебраических корректоров) или в виде специальных булевских функций (логических корректоров). Такой подход позволяет строить алгоритмы, безошибочные на «обучающем» материале или совершающие меньшее число ошибок, чем каждый из исходных алгоритмов.
В 1980-х годах одной из центральных парадигм искусственного интеллекта стало машинное обучение. Некоторое время до этого господствующей тенденцией был поиск неких универсальных механизмов «чистого» мышления, воплощение которых позволило бы создать идеальный интеллект, способный решать любые задачи. Хотя в данном направлении и были достигнуты определенные успехи, они оказались гораздо скромнее, чем исходные ожидания. Неудачные попытки в создании готового идеального интеллекта привели к смещению акцента в сторону построения систем искусственного интеллекта, способных к развитию, совершенствованию, т.е. к обучению. Конечно, здесь имеется в виду стереотипное отношение к проблеме искусственного интеллекта, поскольку и раньше были исследователи, занимавшиеся проблемами адаптивности и обучения (особенно в рамках бионического направления) и обращавшие внимание на социальную природу человеческого интеллекта.
Дать формальное определение обучению крайне затруднительно, но важно то, что обучение - это способность использовать предыдущий опыт для лучшего решения последующих задач. В простейшем случае обучение соответствует простому накоплению данных в процессе функционирования. Например, система машинного обучения, встретившись с задачей, которая уже была ею решена, может воспользоваться старым решением. Однако обучение этим не ограничивается: опыт решения одних задач можно использовать для решения других, для чего нужно обобщить свой опыт.
Машинное обучение - очень обширное направление исследований, перекрывающееся со многими другими областями и включающее рассмотрение различных проблем на основе разных подходов, для которых даже нет устоявшейся классификации. В качестве примера можно привести деление на символьные, коннекционистские (сетевые или на основе связей) и эмерджентные методы обучения [64]. Зачастую методы из одной группы в точности копируют методы другой группы, но сущность подхода выражают в совершенно других терминах, т.е. эта классификация отражает форму методов обучения, но не их алгоритмическое содержание. Все это говорит о том, что область машинного обучения на данный момент является еще не вполне зрелой дисциплиной.
Одним из активно развивающихся направлений машинного обучения является разработка алгоритмов обучения нейронных сетей. Интерес к нейроинтеллекту возник еще на заре развития вычислительной техники. В его основе лежит нейронная организация искусственных систем, которая имеет биологические предпосылки. Способность биологических систем к обучению, самоорганизации и адаптации обладает большим преимуществом по сравнению с современными вычислительными системами. Достоинством компьютерных систем является большая скорость распространения информации и возможность учета большого объема знаний, накопленных человечеством в этой области. Разработка искусственных разумных систем, которые соединяют преимущества биологических существ и современной вычислительной техники, создает потенциальные предпосылки для перехода к качественно новому этапу эволюции в вычислительной технике.
Первые шаги в области искусственных нейронных сетей сделали в 1943 г. В. Маккалох и В. Питтс. Они показали, что при помощи пороговых нейронных элементов можно реализовать исчисление любых логических функций [65]. В 1949 г. Д. Хебб предложил правило обучения [66], которое стало математической основой для обучения ряда нейронных сетей. В 19571962 гг. Ф. Розенблатт предложил и исследовал модель нейронной сети, которую он назвал персептроном. Результаты исследований он обобщил в книге «Принципы нейродинамики», которая имеет большое значение для развития нейронных сетей [67]. В 1959 г. В. Видроу и М. Хофф предложили процедуру обучения для линейного адаптивного элемента - AD ALINE [68]. Процедура обучения получила название «дельта правило». В 1969 г. М. Минский и С. Пайперт опубликовали монографию «Персептроны», в которой был дан математический анализ персептрона, и показали ограничения, присущие ему. Выводы их были довольно пессимистичными, и это сыграло негативную роль для дальнейшего развития исследований в области нейронных сетей. Работы в этой области были практически приостановлены. В 70-е годы появился ряд работ в области ассоциативной памяти. Так, Ж. Андерсон предложил в 1977 г. модель линейной ассоциативной памяти. В этом направлении продолжил исследования Т. Кохонен, который представил модель оптимальной линейной ассоциативной памяти. В 1976 г. С. Гроссберг разработал теорию адаптивного резонанса, которая может быть использована для построения ассоциативной памяти.
В 80-е годы значительно расширяются исследования в области нейройных сетей. Д. Хопфилд в 1982 г. дал анализ устойчивости нейронных сетей с обратными связями и предложил использовать их для решения задач оптимизации. Т. Кохонен разработал и исследовал самоорганизующиеся нейронные сети. Ряд авторов (Д. Румельхарт, Дж. Хинтон, Р. Уильяме) предложил алгоритм обратного распространения ошибки, который стал мощным средством для обучения многослойных нейронных сетей. В 1987 г. под эгидой общества IEEE (Institute Electrical and Electronic Enginneer's) проводится первая международная конференция в области нейронных сетей.
Большой вклад в развитие теории нейронных сетей внесли российские ученые А.И. Галушкин, А.Н. Горбань, В.В. Майоров, М.М. Бонгард, А.Ю. Зиновьевым.
В настоящее время исследования в области искусственных нейронных сетей ориентированы в основном на создание специализированных систем для решения конкретных задач. Разработано большое число нейросистем, применяемых в различных областях: прогнозировании, управлении, диагностике в медицине и технике, распознавании образов и т.д. Рынок продуктов в области нейроинтеллекта стремительно растет. Происходит постепенное накопление критической массы для создания универсальных нейросистем, способных к различного рода интеллектуальной деятельности. В глобальном масштабе задача состоит в создании искусственного разума, обладающего способностью к воспроизводству и эволюции.
Однако в реальных системах задачу распознавания объектов приходится решать в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала. Поэтому для эффективного решения поставленной задачи требуется применение специализированных алгоритмов цифровой обработки изображений (ЦОИ), которая широко используется в системах телекоммуникаций, радио- и гидролокации, сейсмологии, робототехнике, радиоастрономии, медицине.
В настоящее время для устройств цифровой обработки изображений, характерно постоянное возрастание объема обрабатываемой информации, повышение требований к качеству обработки, работа в сложной сигнально-помеховой обстановке. Все это стимулирует появление новых методов и более сложных алгоритмов, используемых в системах ЦОИ. Среди них можно выделить нелинейные алгоритмы фильтрации и восстановления изображений, вейвлет-обработку, системы, построенные на нечеткой логике, генетических алгоритмах, нейронных сетях. Однако влияние таких алгоритмов на решение последующей задачи распознавания объектов на изображении изучено на сегодняшнем этапе развития данной области весьма слабо.
Среди объектов для распознавания и классификации наиболее развитой и актуальной задачей является детектирование и классификация человеческих лиц. В настоящее время эта задача находит применение в различных сферах человеческой деятельности (в первую очередь, в системах безопасности). Сферами применения распознавания лиц являются, например, сравнение фотографий на паспортах или водительских удостоверениях, контроль доступа к безопасным компьютерным сетям и оборудованию в учреждениях, верификация пользователя при проведении финансовых транзакций, наблюдение за аэропортами и вокзалами для предотвращения террористических актов и многие другие [69-72]. Во всех этих приложениях требуется корректно устанавливать личность, как по отдельному статическому изображению лица, так и на видеопоследовательности [73-77]. Естественно, что анализ входной информации должен осуществляться в режиме реального времени [78-79].
Для увеличения надежности процесса распознавания может быть использована такая дополнительная информация, как возраст, пол, расовая принадлежность, выражение лица. Человеческие лица выглядят весьма похожими по своей структуре, отличаясь лишь в деталях для каждого конкретного индивидуума. В классических задачах распознавания образов обычно имеется ограниченное число классов с большим числом обучающих примеров для каждого из них. При распознавании лиц, напротив, мы сталкиваемся с тем, что возможных классов может быть очень много, в то время как число обучающих примеров относительно невелико.
Процесс распознавания лиц может быть разделен на два этапа. На первом из них осуществляется нахождение и выделение лица на изображении - так называемый процесс «детектирования лица» [80-85]. Второй этап представляет собой непосредственно распознавание лица - т.е. установление степени сходства с одним из лиц «известных» системе [85-89].
Для построения полностью автоматизированных технических систем для распознавания лиц, которые будут анализировать информацию, содержащуюся в изображении лица, требуются робастные и эффективные алгоритмы выделения лиц. Имея на входе единственное изображение, цель алгоритма выделения лиц состоит в определении всех областей изображения, содержащих лицо, несмотря на их положение в пространстве, ориентацию и условия освещенности. Это очень сложная задача, поскольку лицо является неоднородным объектом и обладает высокой степенью изменчивости размера, формы, цвета и текстуры.
Дадим определение задачи выделения лица на изображении. При произвольном изображении на входе целью алгоритма выделения лиц является определение того, есть ли на изображении лица, и, если есть, указать положение и размер каждого из них.
С выделением лиц связан ряд схожих задач. Целью задачи локализации лица является определение положения единственного лица на изображении. Это упрощенная задача выделения лиц в предположении, что входное изображение содержит только одно лицо [90-91]. Целью задачи детектирования признаков лица является определение присутствия и положения значимых признаков лица, таких как глаза, нос, ноздри, рот, губы, уши и т.д., в предположении, что присутствует только одно лицо на изображении [92-93]. При распознавании или идентификации лица входное
12 пробное) изображение сравнивается с изображениями из базы (галереи) и между ними устанавливается соответствие, если оно есть [94-96]. Целью аутентификации по лицу является проверка прав доступа человека по входному изображению [97-98], а с помощью методов сопровождения лица выполняется оценка положения и возможно ориентации лица на последовательности изображений в реальном времени [99-101]. Распознавание выражения лица концентрируется на идентификации эмоциональных состояний (счастье, грусть, злость и т.д.) людей. Очевидно, что выделение лиц является первым этапом решения любой из перечисленных выше задач.
Важной задачей является также оценка качества работы алгоритмов, которое оценивается, как правило, в терминах уровней выделения и ложных срабатываний. Под уровнем выделения понимают отношение числа лиц, верно детектированных алгоритмом, и числа лиц, детектированных человеком. Область на изображении, идентифицированная классификатором как лицо, является корректно детектированной, если эта область охватывает больше, чем определенный процент лица на изображении. В основном детекторы могут порождать два типа ошибок: пропущенные области, что в результате приводит к низкому уровню выделения, и ложные срабатывания, т.е. области которые относятся алгоритмом к классу лиц, но при этом лицами не являются. Правильная оценка работы алгоритма должна принимать в расчет эти факторы, поскольку можно настроить параметры метода таким образом, что увеличится уровень выделения, однако при этом возрастет и уровень ложных срабатываний.
При наличии более 150 описанных подходов исследования в области выделения лиц продолжают расширяться. Задача выделения лиц может быть представлена как задача распознавания двух классов, в которой изображение классифицируется как «лицо» или «нелицо». Следовательно, выделение лиц - это одна из попыток распознать по изображениям объекты, которые обладают высокой внутриклассовой изменчивостью, которая только возрастает в условиях изменения положения камеры и освещения.
Проблему усугубляет наличие на изображении различных искажений, таких как наличие шума, артефактов сжатия, размытия и др. Однако поскольку большинство изображений, с которыми работают современные системы, являются цветными, то задача детектирования на таких изображениях может быть решена более уверенно, если использовать информацию из всех цветовых каналов. Таким образом, разработка новых алгоритмов детектирования и классификации объектов, способных работать в режиме реального времени в условиях сложной сигнально-помеховой обстановки, представляет на сегодняшний день актуальную научно-техническую задачу.
Основной целью работы является разработка и исследование новых алгоритмов детектирования и классификации объектов на полутоновых и цветных изображениях в условиях наличия искажений, связанных с помехами в радиотехнических устройствах.
Для достижения указанной цели в диссертационной работе решаются следующие задачи:
- разработка алгоритмов детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки;
- усовершенствование работы алгоритмов детектирования лиц с использованием информации о цвете;
- разработка новых алгоритмов тендерной классификации по цифровому изображению лица для решения ряда практических задач в области современных систем телевидения.
Методы исследования. При решении поставленных задач использовались современные методы распознавания образов, машинного обучения, цифровой обработки изображений, математического анализа,
14 теории вероятностей. Для практической реализации алгоритмов применялись современные численные методы и методы объектно-ориентированного программирования на языке С#.
Достоверность полученных научных результатов. Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.
Научная новизна. В рамках данной работы получены следующие новые научные результаты.
1. Разработаны новые алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.
2. Разработана модификация алгоритмов детектирования лиц с использованием информации о цвете.
3. Разработан новый алгоритм тендерной классификации по изображению лица на основе адаптивных признаков и метода опорных векторов.
Практическая ценность
1. Проведен анализ работы алгоритмов детектирования лиц при наличии искажающих факторов и предложены рекомендации по их устранению, позволившие повысить уровень выделения в среднем на 20-30%.
2. Разработаны модификации алгоритма детектирования лиц на базе бустинга путем использования информации о цвете, позволившие снизить уровень ложных срабатываний более чем в 2 раза.
3. Разработан и исследован алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов для решения ряда практических задач в области современных систем телевидения.
Результаты работы внедрены в соответствующие разработки ООО «А-ВИЖН», ОАО «СеверТрансКом», г. Ярославль.
Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплины «Цифровая обработка изображений», а также в научно-исследовательские работы при выполнении исследований в рамках гранта «Развитие нелинейной теории обработки сигналов и изображений в радиотехнике и связи» (Программа «Развитие научного потенциала высшей школы (2009-2010 годы)», №2.1.2/7067).
Все результаты внедрения подтверждены соответствующими актами.
На защиту диссертации выносятся следующие основные результаты:
Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК
Разработка теории, методов и алгоритмов машинного зрения в задачах обнаружения объектов2002 год, доктор технических наук Желтов, Сергей Юрьевич
Усовершенствование алгоритмов удаления шума из изображений на основе модифицированных критериев оценки качества2008 год, кандидат технических наук Апальков, Илья Владимирович
Исследование и разработка методов реализации детекторов сигналов систем многочастотных телефонных сигнализаций на цифровых сигнальных процессорах1999 год, кандидат технических наук Лоенко, Игорь Федорович
Разработка и анализ неэталонных алгоритмов оценки качества сжатых изображений2008 год, кандидат технических наук Саутов, Евгений Юрьевич
Разработка алгоритмов анализа аудитории для систем прикладного телевидения2016 год, кандидат наук Матвеев Дмитрий Вячеславович
Заключение диссертации по теме «Радиотехника, в том числе системы и устройства телевидения», Голубев, Максим Николаевич
Основные результаты диссертации можно сформулировать в следующем виде.
1. Проведено сравнение трех современных алгоритмов выделения лиц на изображениях на базе обучения. Это алгоритмы на базе процедуры бустинга, на базе обучающей сети SNoW и на базе метода опорных векторов. Лучший результат по уровню выделения лиц на неискаженных изображениях показал алгоритм на базе SNoW - 87,3%. На втором и третьем местах алгоритмы на базе бустинга (82,6%) и МОВ (62,4%) соответственно.
2. Исследовано влияние на работу тестируемых алгоритмов нескольких типов искажений: гауссов шум, импульсный шум, размытие и сжатие JPEG. Результаты проведенных экспериментов показали, что алгоритм на базе бустинга более устойчив к искажениям всех типов. Он значительно превосходит другие тестируемые алгоритмы по среднему уровню выделения при внесении гауссова и импульсного шумов на 33%), а также при сжатии JPEG (~ на 20%). При размытии алгоритм на базе бустинга уступает по среднему уровню выделения 6,6% алгоритму на базе SNoW, однако при этом он допускает в 4 раза меньше ошибок классификации.
3. Разработана модификация для алгоритма выделения лиц на основе детектора пикселей кожи. Применение детектора кожи позволяет уменьшить количество ложных срабатываний на цветных изображениях при небольшом уменьшении уровня выделения.
Проведено сравнение двух алгоритмов детектирования кожи. Это алгоритм, использующий явное задание кластера кожи и алгоритм, использующий непараметрическую модель кожи. Алгоритм, использующий явное задание цвета кожи, ограничен одной областью цветовых оттенков. Предлагаемый автором алгоритм является более
175 гибким, и его работа определяется набором обучающих изображений. Он показывает на 9% меньше ложных срабатываний при большем уровне детектирования (на 3%).
4. Предложен алгоритм классификации изображений на базе адаптивных признаков и метода опорных векторов для работы в современных системах телевидения, решающий задачу распознавания пола людей по изображению лица с точностью порядка 80%. Результаты тестирования показывают, что предлагаемый алгоритм превосходит другие рассматриваемые алгоритмы по всем основным параметрам. Его уровень верного распознавания составил 79,6%, что на 1,9% больше, чем у классификатора МОВ и на 9,9% больше, чем у алгоритма ЮЖА. Количество фрагментов, обрабатываемых АП-МОВ в секунду, составило 65, что в 1,44 раза больше по сравнению с другими тестируемыми алгоритмами.
5. Адаптивный характер генерации набора признаков в процедуре обучения АП-МОВ позволяет использовать данный классификатор для распознавания любых других объектов, находящихся на изображении (помимо лиц). Для этого необходимо лишь сформировать обучающий набор фрагментов для каждого рассматриваемого класса и переобучить классификатор в соответствии с методикой, приведенной в работе.
6. Для демонстрации работы описанных алгоритмов и проведения дальнейших исследований по данной тематике создана научно-исследовательская среда для детектирования и распознавания лиц 11есо^Шоп.ЬаЬ.
ЗАКЛЮЧЕНИЕ
Список литературы диссертационного исследования кандидат технических наук Голубев, Максим Николаевич, 2012 год
1. Файн B.C. Опознавание изображений (основы непрерывно-групповой теории и ее приложения) // М.: «Наука», 1970.
2. Фу К. Структурные методы распознавания образов // М.: Мир, 1977.
3. Фурман Я.А. Юрьев А.Н. Яншин В.В. Цифровые методы обработки и распознавания бинарных изображений // Красноярск: Изд-во Краснояр. ун-та, 1992.
4. Гренандер У. Лекции по теории образов // Под ред. Ю. Журавлева М.: Мир, 1979.
5. Патрик Э. Основы теории распознавания образов // Под ред. Б.Р. Левина М.: Сов. радио, 1980.
6. Прикладные нечеткие системы: Пер. с япон. // К. Асаи, Д. Ватада, С. Иваи и др.: под редакцией Т. Тэранко, К. Асаи, М. Сугэно М.: Мир, 1993.
7. Ту Дж., Гонсалес Р. Принципы распознавания образов // Под редакцией Ю.И. Журавлева М.: Мир. 1978.
8. Пересада В.П. Автоматическое распознавание образов // Л.: «Энергия»,1970.
9. Дуда Р., Харт П. Распознавание образов и анализ сцен // Под редакцией В.Л. Стефанюка, М.: Мир. 1976.
10. Ю.Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения) // М.: Наука, 1974.
11. П.Журавлев Ю.И., Рязанов В.В., Сенько О.В. Распознавание. Математические методы. Программная система. Практические применения. // М.: Фазис, 2005.
12. Форсайт Д.А., Понс Д. Компьютерное зрение. Современный подход // М.: «Вильяме», 2004.
13. Потапов А.С. Распознавание образов и машинное восприятие: общий подход на основе принципа минимальной длины описания. // СПб.: Политехника, 2007.
14. Николенко С. И., Тулупьев A.JI. Самообучающиеся системы // М.: МЦНМО, 2009.
15. Sammut С., Webb G.I. Encyclopedia of Machine Learning // Springer, 2011.
16. Люгер Дж. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем // М.: «Вильяме», 2003
17. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения // М.: Едиториал УРСС, 2011.
18. Гонсалес Р., Вудс Р. Цифровая обработка изображений // М.: Техносфера, 2005.
19. Методы компьютерной обработки изображений // Под ред. В.А. Сойфера М.: Физматлит, 2001.
20. Журавлев Ю.И. Избранные научные труды // М.: Издательство Магистр, 1998.
21. Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации. Проблемы кибернетики // М.: Наука, 1978. Вып. 33. С. 5-68.
22. Neyman J., Pearson E.S. On the problem of the most efficient tests of statistical hypothesis // Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 1933. V. 231 P. 289-337.
23. Fisher R.A. The use of multiple measurements in taxonomic problems // Ann. Eugenics, 1936. V. 7, Part II, P. 179-188.
24. Wald A. Contributions to the theory of statistical estimation and testing of hypotheses // Ann.Math.Stat., 1939. V. 10, P. 299-326.
25. Розенблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга) // М.: Мир, 1965.
26. Айвазян С.А. и др. Прикладная статистика: Классификация и снижение размерности // М.: Финансы и статистика, 1989.
27. Айзерман М.А., Браверманн Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин // М.: Наука, 1970.
28. Бонгард М.М. Проблема узнавания // М.: Наука, 1967.29.3агоруйко Н.Г. Методы распознавания и их применение //М.: Сов.радио, 1972.
29. ЗО.Загоруйко Н.Г. Прикладные методы анализа данных и знаний // Новосибирск: Изд-во Института математики, 1999.
30. Ивахненко А.Г. Системы эвристической самоорганизации в технической кибернетике // Киев: Техшка, 1971.
31. Лбов Г.С. Методы обработки разнотипных экспериментальных данных//Новосибирск: Наука, 1981.
32. Метод комитетов в распознавании образов. // Свердловск: ИММ УНЦ АН СССР, 1974.
33. Себастьян Г.С. Процессы принятия решений при распознавании образов // М.: Изд-во «Техника», 1965.
34. Уоссермен Ф. Нейрокомпьютерная техника // М.: Мир, 1992.
35. Фукунага К. Введение в статистическую теорию распознавания образов // М.: Наука, 1979.
36. Fu K.S. Sequential Methods in Pattern Recognition and Machine Learning // Academic Press, New York, 1968.
37. Minsky M., Papert S. Perceptrons: An Introduction to Computational Geometry // MIT Press, Cambridge, Mass., 1969.
38. Nilsson NJ. Learning Machines // McGraw-Hill, New York, 1965.
39. Мазуров В л. Д. Комитеты систем неравенств и задача распознавания // Кибернетика. 1971. №3. С. 140-146.
40. Мазуров Вл.Д., Хачай М.Ю. Комитеты систем линейных неравенств// Автоматика и телемеханика. 2004. Вып. 2, С. 43-54.
41. Дмитриев А.Н., Журавлев Ю.И., Кренделев Ф.П., О математических принципах классификации предметов и явлений // Сб. «Дискретный анализ», Новосибирск, ИМ СО АН СССР, 1966. Вып. 7.
42. Журавлев Ю.И., Никифоров В.В. Алгоритмы распознавания, основанные на вычислении оценок // Кибернетика. 1971. №3. С. 1-11.
43. Журавлев Ю.И. Корректные алгебры над множествами не корректных (эвристических) алгоритмов // Кибернетика. 1977. I. № 4. С. 5-17. , И. Кибернетика, № 6, 1977, III. Кибернетика. 1978. №2. С. 35-43.
44. Рудаков К.В. Об алгебраической теории универсальных и локальных ограничений для задач классификации // Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1,С. 176-200.
45. Матросов B.JI. Синтез оптимальных алгоритмов в алгебраических замыканиях моделей алгоритмов распознавания// Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1,С. 229-279.
46. Рязанов В.В. О построении оптимальных алгоритмов распознавания и таксономии (классификации) при решении прикладных задач //
47. Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1, С. 229-279.
48. Рязанов В.В. Комитетный синтез алгоритмов распознавания и классификации // ЖВМ и МФ. 1981. Том 21, №6. С.1533-1543.
49. Рязанов В.В. О синтезе классифицирующих алгоритмов на конечных множествах алгоритмов классификации (таксономии) // ЖВМ и МФ, 1982. Том 22, №2. С.429-440.
50. Дюкова Е.В. Асимптотически оптимальные тестовые алгоритмы в задачах распознавания//Проблемы кибернетики. М.: Наука, 1982. Вып. 39. С. 165-199.
51. Дюкова Е.В. Алгоритмы распознавания типа "Кора": сложность реализации и метрические свойства// Распознавание, классификация, прогноз (матем. методы и их применение). М.: Наука, 1989. Вып.2. С. 99-125.
52. Сенько О.В. Использование процедуры взвешенного голосования по системе базовых множеств в задачах прогнозирования// М. Наука, Ж. вычисл. матем. и матем. физ. 1995, т. 35, № 10, С. 1552-1563.
53. Aslanyan L., Zhuravlev Yu. Logic Separation Principle // Computer Science & Information Technologies Conference, Yerevan, September 17-20, 2001, 151-156.
54. Донской В.И. Алгоритмы обучения, основанные на построении решающих деревьев// Журнал выч. мат. и матем. физики. 1982, т. 22, №4, с. 963-974.
55. Донской В.И., Башта А.И. Дискретные модели принятия решений при неполной информации // Симферополь: Таврия, 1992.
56. Дюк В., Самойленко A. Data Mining: учебный курс // СПб: Питер, 2001.
57. Голубев М.Н., Шмаглит Л.А., Ганин А.Н. Разработка и анализ системы автоматического распознавания пола людей по изображению лица // XIV Всероссийская научно-техническая конференция «Нейроинформатика-2012».
58. Makinen Е., Raisamo R. An experimental comparison of gender classification methods // Pattern Recognition Letters 29, 2008. № 10, P. 1544-1556.
59. Burges C. A Tutorial on Support Vector Machines for Pattern Recognition // Data Mining and'Knowledge Discovery, 1998. V. 2, P. 121-167.
60. Gao H., Davis J. Why direct LDA is not equivalent to LDA // Pattern Recognition Letters 39, 2006. № 5, P. 1002-1006.
61. Голубев M.H., Брюханов Ю.А. Исследовательская среда PicLab.Signage.Demo: обзор возможностей // Тр. LXVI науч. сессии, посвященной Дню Радио. Москва, 2011. С. 350-353.
62. Тарасова Д.А., Тихонова Т.С., Голубев М.Н. Предварительная обработка изображений в задаче распознавания // Тез. докл. 15-ой междунар. науч.-тех. конф. «Радиоэлектроника, электротехника и энергетика». Москва. 2009. Т.1, С. 27-28.
63. Вайнцвайг М.Н. Алгоритм обучения распознаванию образов «Кора» // Алгоритмы обучения распознаванию образов. М.: Сов.радио, 1973. С. 8-12.
64. Mcculloh, Pitts A logical calculus of the ideas immanent in nervous activity
65. Bulletin of Mathematical Biophysics, 1943. №5, P. 115-133.182
66. НеЬЬ D.O. Organisation of Behavior // John Wiley & Sons, New York, 1949.
67. Розенблатт Ф. Принципы нейродинамики: Перцептроны и теория механизмов мозга // М.: Мир, 1965.
68. Widrow В., Hoff М. Adaptive switching circuits // IRE WESCON Convention Record, 1960. Part 4. P. 96-104.
69. Kotropoulos C., Pitas I. Rule-Based Face Detection in Frontal Views // Proc. Int'l Conf. Acoustics, Speech and Signal Processing, 1997. V. 4, P. 2537-2540.
70. Sakai Т., Nagao M. Fujibayashi S. Line Extraction and Pattern Detection in a Photograph // Pattern Recognition, 1969. V. 1, P. 233-248.
71. Craw I., Ellis H., Lishman J. Automatic Extraction of Face Features // Pattern Recognition Letters, 1987. V. 5, P. 183-187.
72. Govindaraju V. Locating Human Faces in Photographs // Int'l J. Computer Vision, 1996. V. 19, P. 129-146.
73. Sobottka K., Pitas I. A novel method for automatic face segmentation, facial feature extraction and tracking // Signal Processing: Image Communication, 1998. Vol. 12, P. 263-281.
74. Smeraldi F., Carmona O., Bigun J. Saccadic search with Gabor features applied to eye detection and real-time head tracking // Image Vision Comput. 18, 2000. P. 323-329.
75. De Silva L.C., Aizawa K., Hatori M. Detection and tracking of facial features by using a facial feature model and deformable circular template // IEICE Trans. Inform. Systems EZ8-D(9), 1995. P. 1195-1207.
76. Vezhnevets V. Face and Facial Feature Tracking for Natural HumanComputer Interface. Moscow, 2002.
77. Bradski G. Computer Vision Face Tracking For Use in a Perceptual User Interface, Intel Technology Journal Q2, 1998.
78. Yang J., Waibel A. A Real-time Face Tracker // IEEE Proc. of the 3rd Workshop on Applications of Computer Vision, Florida, 1996.
79. Froba B., Kublbeck. C. Real-time Face Detection Using Edge-orientation Matching // Audio- and Video-based Biometric Person Authentication (AVBPA'2001), Halmstad, Sweden, 2001, P 78-83.
80. Yang M.-H., Ahuja N., Kriegman D. Face Detection Using Multimodal Density Models // Computer Vision and Image Understanding (CVIU), 2001. V. 84, P. 264-284.
81. Sung K.-K., Poggio T. Example-Based Learning for View- Based Human Face Detection // IEEE Trans. Pattern Analysis and Machine Intelligence, 1998. V. 20, P. 39-51.
82. Jochen Maydt, Rainer Lienhart. Face Detection with Support Vector Machines and a Very Large Set of Linear Features // IEEE ICME 2002, Lousanne, Switzerland, 2002.
83. Roth D., Yang M.-H., Ahuja N. A SNoW-based face detector // In Advances in Neural Information Processing Systems 12 (NIPS 12), MIT Press, Cambridge, MA, 2000. P. 855-861.
84. Juell P., Marsh R. A hierarchical neural network for human face detection // Pattern Recog. 29, 1996. P. 781-787.
85. Rowley H.A., Baluja S., Kanade T. Neural network-based face detection // IEEE Trans. Pattern Anal. Mach. Intell. 20, 1998. P. 23-38.
86. Lin S.-H., Kung S.-Y., Lin L.-J. Face recognition/detection by probabilistic decision-based neural network // IEEE Trans. Neural Networks 8, 1997. P. 114-132.
87. Edwards G.J., Taylor C.J., Cootes T.F. Interpreting Face Images using Active Appearance Models // Int. Conf. on Face and Gesture Recognition 1998. P. 300-30.
88. Stan Z. Li, Anil K. Jain. Handbook of Face Recognition // Springer Science+Business Media, 2005.
89. Belhumeur P.N., Hespanha J.P., Kriegman D.J. Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection // IEEE Transactions on pattern analysis and machine intelligence, 1997, V. 19, № 7.
90. Lam K., Yan H. Fast Algorithm for Locating Head Boundaries // J. Electronic Imaging, 1994 V. 3, № 4, P. 351-359.
91. Moghaddam B., Pentland A. Probabilistic visual learning for object representation // IEEE Trans. Pattern Anal. Mach. Intell. 19(1), 1997. P. 696-710.
92. Craw I., Tock D., Bennett A. Finding Face Features // Proc. Second European Conf. Computer Vision, 1992, P. 92-96.
93. Graf H.P., Chen T., Petajan E., Cosatto E. Locating Faces and Facial Parts // Proc. First Int'l Workshop Automatic Face and Gesture Recognition, 1995, P. 41-46.
94. Turk M., Pentland A. Eigenfaces for Recognition // J. Cognitive Neuroscience, 1991, V. 3, № 1, P. 71-86.
95. Samal A., Iyengar P.A. Automatic Recognition and Analysis of Human Faces and Facial Expressions: A Survey // Pattern Recognition, 1992, V. 25, № 1, P. 65-77.
96. Chellappa R., Wilson C.L., Sirohey S. Human and Machine Recognition of Faces: A Survey // Proc. IEEE, 1995, V. 83, № 5, P. 705-740.
97. Tefas A., Kotropoulos C., Pitas I. Variants of Dynamic Link Architecture Based on Mathematical Morphology for Frontal Face Authentication //
98. Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 814819.
99. Kotropoulos C., Tefas A., Pitas I. Frontal Face Authentication Using Variants of Dynamic Link Matching Based on Mathematical Morphology // Proc. IEEE Int'l Conf. Image Processing, 1998, P. 122-126.
100. Crowley J.L., Berard F. Multi-Modal Tracking of Faces for Video Communications // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 640-645.
101. Edwards G.J., Taylor C J., Cootes T. Learning to Identify and Track Faces in Image Sequences // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 317-322.
102. Darrell T., Gordon G., Harville M., Woodfill J. Integrated Person Tracking Using Stereo, Color, and Pattern Detection // Int'l J. Computer Vision, 2000, V. 37, № 2, P. 175-185.
103. Yang G., Huang T.S. Human Face Detection in Complex Background // Pattern Recognition, 1994. V. 27, P. 53-63.
104. Leung T.K., Burl M.C., Perona P. Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching // Proc. Fifth IEEE Int'l Conf. Computer Vision, 1995, P. 637-644.
105. Yow K.C., Cipolla R. Feature-Based Human Face Detection // Image and Vision Computing, 1997, V. 15, № 9, P. 713-735.
106. Dai Y., Nakano Y. Face-Texture Model Based on SGLD and Its Application in Face Detection in a Color Scene // Pattern Recognition, 1996, V. 29, № 6, P. 1007-1017.
107. McKenna S., Gong S., Raja Y. Modelling Facial Colour and Identity with Gaussian Mixtures // Pattern Recognition, 1998, V. 31, № 12, P. 18831892.
108. Oliver N., Pentland A., Berard F. LAFER: Lips and Face Real Time Tracker // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 123-129.
109. Lanitis A., Taylor C.J., Cootes T.F. An Automatic Face Identification System Using Flexible Appearance Models // Image and Vision Computing, 1995, V. 13, №5, P. 393-401.
110. Osuna E., Freund R., Girosi F. Training Support Vector Machines: An Application to Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 130-136.
111. Schneiderman H., Kanade T. Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 45-51.
112. Rajagopalan A., Kumar K., Karlekar J., Manivasakan R., Patil M., Desai U., Poonacha P., Chaudhuri S. Finding Faces in Photographs // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 640-645.
113. Lew M.S. Information Theoretic View-Based and Modular Face Detection // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 198-203.
114. Colmenarez A.J., Huang T.S. Face Detection with Information-Based Maximum Discrimination // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 782-787.
115. Kanade T. Picture Processing by Computer Complex and Recognition of Human Faces // PhD thesis, Kyoto Univ., 1973.
116. Sobottka, Pitas I. Segmentation and Tracking of Faces in Color Images // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 236-241.
117. Canny J. A Computational Approach to Edge Detection // IEEE Trans.
118. Pattern Analysis and Machine Intelligence, 1986, V. 8, № 6, P. 679-698.187
119. Chetverikov D., Lerch A. Multiresolution Face Detection 11 Theoretical Foundations of Computer Vision, 1993, V. 69, P. 131-140.
120. Amit Y., Geman D., Jedynak B. Efficient Focusing and Face Detection // Face Recognition: From Theory to Applications, Wechsler H., Phillips P.J., Bruce V., Fogelman-Soulie F., Huang T.S., eds., 1998, V. 163, P. 124-156.
121. Amit Y., Geman D., Wilder K. Joint Induction of Shape Features and Tree Classifiers // IEEE Trans. Pattern Analysis and Machine Intelligence, 1997, V. 19, № 11, P. 1300-1305.
122. Breiman L., Friedman J., Olshen R., Stone C. Classification and Regression Trees. Wadsworth, 1984.
123. Samaria F.S. Face Recognition Using Hidden Markov Models // PhD thesis, Univ. of Cambridge, 1994.
124. Augusteijn M.F., Skujca T.L. Identification of Human Faces through Texture-Based Feature Recognition and Neural Network Technology // Proc. IEEE Conf. Neural Networks, 1993, P. 392-398.
125. Haralick R.M., Shanmugam K., Dinstein I. Texture Features for Image Classification III IEEE Trans. Systems, Man, and Cybernetics, 1973, V. 3, №6, P. 610-621.
126. Fahlman S., Lebiere C. The Cascade-Correlation Learning Architecture // Advances in Neural Information Processing Systems 2, Touretsky D.S., ed., 1990, P. 524-532.
127. Kohonen T. Self-Organization and Associative Memory // Springer, 1989.
128. Chai D., Ngan K.N. Locating Facial Region of a Head-and-Shoulders Color Image // Proc. Third Int'l Conf. Automatic Face and Gesture Recognition, 1998, P. 124-129.
129. Hotta K., Kurita T., Mishima T. Scale Invariant Face Detection Method Using Higher-Order Local Autocorrelation Features Extracted from Log
130. Polar Image // Proc. Third Int'l Conf. Automatic Face and Gesture Recognition, 1998, P. 70-75.
131. Chen Q., Wu H., Yachida M. Face Detection by Fuzzy Matching // Proc. Fifth IEEE Int'l Conf. Computer Vision, 1995, P. 591-596.
132. Wu H., Yokoyama T., Pramadihanto D., Yachida M. Face and Facial Feature Extraction from Color Image // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 345-350.
133. Wu H., Chen Q., Yachida M. Face Detection from Color Images Using a Fuzzy Pattern Matching Method // IEEE Trans. Pattern Analysis and Machine Intelligence, 1999, V. 21, № 6, P. 557-563.
134. Sinha P. Object Recognition via Image Invariants: A Case Study // Investigative Ophthalmology and Visual Science, 1994, V. 35, № 4, P. 1735-1740.
135. Sinha P. Processing and Recognizing 3D Forms // PhD thesis, Massachusetts Inst, of Technology, 1995.
136. Papageorgiou C., Poggio T. A Trainable System for Object Recognition // Int'l J. Computer Vision, 2000, V. 38, № 1, p. 15-33, 2000.
137. B. Scassellati, "Eye Finding via Face Detection for a Foevated, Active Vision System," Proc. 15thNat'l Conf. Artificial Intelligence, 1998.
138. C. Breazeal and B. Scassellati, "A Context-Dependent Attention System for a Social Robot," Proc. 16th Int'l Joint Conf. Artificial Intelligence, 1999, V. 2, P. 1146-1151.
139. Yuille A., Hallinan P., Cohen D. Feature Extraction from Faces Using Deformable Templates // Int'l J. Computer Vision, 1992, V. 8, № 2, P. 99111.
140. Kwon Y.H., N. da Vitoria Lobo Face Detection Using Templates // Proc. Int'l Conf. Pattern Recognition, 1994, P. 764-767.
141. Kass M., Witkin A., Terzopoulos D. Snakes: Active Contour Models // Proc. First IEEE Int'l Conf. Computer Vision, 1987, P. 259-269.
142. Leymarie F., Levine M.D. Tracking Deformable Objects in the Plan Using an Active Contour Model // IEEE Trans. Pattern Analysis and Machine Intelligence, 1993, V. 15, № 6, P. 617-634.
143. Kirby M., Sirovich L. Application of the Karhunen-Loe've Procedure for the Characterization of Human Faces // IEEE Trans. Pattern Analysis and Machine Intelligence, 1999, V. 12, № 1, P. 103-108.
144. Karhunen K. Uber Lineare Methoden in der Wahrscheinlichkeitsrechnung // Annales Academiae Sciientiarum Fennicae, Series AI: Mathematica-Physica, 1946, V. 37, P. 3-79, 1946.
145. Loe've M.M. Probability Theory // Princeton, N.J.: Van Nostrand, 1955.
146. Fukunaga K. Introduction to Statistical Pattern Recognition // New York: Academic, 1972.
147. Sung K.-K. Learning and Example Selection for Object and Pattern Detection // PhD thesis, Massachusetts Inst, of Technology, 1996.
148. Oren M., Papageorgiou C., Sinha P., Osuna E., Poggio T. Pedestrian Detection Using Wavelet Templates // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 193-199.
149. Kervrann C., Davoine F., Perez P., Li H., Forchheimer R., Labit C. Generalized Likelihood Ratio-Based Face Detection and Extraction of Mouth Features // Proc. First Int'l Conf. Audio- and Video-Based Biometric Person Authentication, 1997, P. 27-34.
150. Agui T., Kokubo Y., Nagashashi H., Nagao T. Extraction of Face Recognition from Monochromatic Photographs Using Neural Networks // Proc. Second Int'l Conf. Automation, Robotics, and Computer Vision, 1992, V. 1,P. 18.8.1-18.8.5.
151. Propp M., Samal A. Artificial Neural Network Architectures for Human Face Detection // Intelligent Eng. Systems through Artificial Neural Networks, V. 2.
152. Waibel A., Hanazawa T., Hinton G., Shikano K., Lang K. Phoneme Recognition Using Time-Delay Neural Networks // IEEE Trans. Pattern Analysis and Machine Intelligence, 1989, V. 37, № 3, P. 328-339.
153. Rowley H., Baluja S., Kanade T. Neural Network-Based Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1996, P. 203208.
154. Rowley H., Baluja S., Kanade T. Human Face Detection in Visual Scenes // Advances in Neural Information Processing Systems 8, Touretzky D.S., Mozer M.C., and Hasselmo M.E., eds., 1996, P. 875-881.
155. Vaillant R., Monrocq C., Le Cun Y. An Original Approach for the Localisation of Objects in Images // IEE Proc. Vision, Image and Signal Processing, 1994, V. 141, P. 245-250.
156. Burel G., Carel D. Detection and Localization of Faces on Digital Images // Pattern Recognition Letters, 1994, V. 15, № 10, P. 963-967.
157. Rowley H., Baluja S., Kanade T. Rotation Invariant Neural Network-Based Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 38-44.
158. Schneiderman H., Kanade T. A Statistical Method for 3D Object Detection Applied to Faces and Cars // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 2000, V. 1, P. 746-751.
159. Rikert T., Jones M., Viola P. A Cluster-Based Statistical Model for Object Detection // Proc. Seventh IEEE Int'l Conf. Computer Vision, 1999, V. 2, P. 1046-1053.
160. Rabiner L.R., Jung B.-H. Fundamentals of Speech Recognition // Prentice Hall, 1993.
161. Qian R.J., Huang T.S. Object Detection Using Hierarchical MRF and MAP Estimation // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 186-192.
162. Cover T., Thomas J. Elements of Information Theory // Wiley Interscience, 1991.
163. Fukunaga F., Koontz W. Applications of the Karhunen-Loe've Expansion to Feature Selection and Ordering // IEEE Trans. Computers, 1970, V. 19, №5, P. 311-318.
164. Pentland A., Moghaddam B., Starner T. View-Based and Modular Eigenspaces for Face Recognition // Proc. Fourth IEEE Int'l Conf. Computer Vision, 1994, P. 84-91.
165. Quinlan J.R. C4. 5: Programs for Machine Learning // Kluwer Academic, 1993.
166. Huang J., Gutta S., Wechsler H. Detection of Human Faces Using Decision Trees // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 248-252.
167. Duta N., Jain A.K. Learning the Human Face Concept from Black and White Pictures // Proc. Int'l Conf. Pattern Recognition, 1998, P. 1365-1367.
168. Mitchell T. Machine Learning // McGraw Hill, 1997.
169. Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // Proc. Int. Conf. on Computer Vision and Pattern Recognition. 2001. № 1. P. 511-518.
170. Баринова О.В., Ветров Д.П. Оценки обобщающей способности бустинга с вероятностными входами // Материалы 14-й Всероссийской конференции «Математические методы распознавания образов», Суздаль, 2009. С. 81-84.
171. Crowley J.L., Bedrune J.M. Integration and Control of Reactive Visual Processes // Proc. Third European Conf. Computer Vision, 1994, V. 2, P. 47-58.
172. Jordan M.I., Jacobs R.A. Hierarchical mixtures of experts and the EM algorithm // Neural Computation. 1994. № 6. P. 181-214.
173. Miller D., Uyar H. A mixture of experts classifier with learning based on both labeled and unlabeled data // Neural information processing systems. 1996. №9. P. 571-577.
174. Roth D. Learning to Resolve Natural Language Ambiguities: A Unified Approach // Proc. 15th Nat'l Conf. Artificial Intelligence, 1998, P. 806-813.
175. Carleson A., Cumby C., Rosen J., Roth D. The SNoW Learning Architecture // Technical Report UIUCDCS-R-99-2101, Univ. of Illinois at Urbana-Champaign Computer Science Dept., 1999.
176. Littlestone N. Learning Quickly when Irrelevant Attributes Abound: A New Linear-Threshold Algorithm // Machine Learning, 1988, V. 2, P. 285318.
177. Hallinan P. A Deformable Model for Face Recognition Under Arbitrary Lighting Conditions // PhD thesis, Harvard Univ., 1995.
178. Phillips P.J., Moon H., Rizvi S.A., Rauss P.J. The FERET evaluation methodology for face-recognition algorithms // IEEE Transactions on pattern analysis and machine intelligence, 2000, V. 22, № 10.
179. Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP 2007, V. 2, P. 589-592.
180. Nilsson M., Dahl M., Claesson I. The successive mean quantization transform // Proceedings of IEEE Int. Conf. ICASSP, 2005, V. 4, P. 429432.
181. Roth D. The SNoW Learning Architecture // Technical Report UIUCDCS-R-99-2102, UIUC Computer Science Department, 1999.
182. Sung K.-K., Poggio T. Example-Based Learning for View-Based Human Face Detection // Technical Report AI Memo 1521, Massachusetts Inst, of Technology AI Lab, 1994.
183. Papageorgiou C., Oren M., Poggio T. A General Framework for Object Detection // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 555562.
184. Kienzle W., Bakir G., Franz M., Scholkopf B. Face Detection Efficient and Rank Deficient // Adv. in Neural Inf. Proc. Systems, 2005. V.17, P. 673-680.
185. Метод опорных векторов // Цифровая библиотека лаборатории компьютерной графики и мультимедиа при факультете ВМиК МГУ, (http ://library .graphicon.ru/catalog/217).
186. Yang M.-H., Ahuja N., Kriegman D. Mixtures of Linear Subspaces for Face Detection // Proc. Fourth Int'l Conf. Automatic Face and Gesture Recognition, 2000, P. 70-76.
187. Provost F., Fawcett T. Robust Classification for Imprecise Environments
188. Machine Learning, 2001. V. 42, P. 203-231.194
189. Приоров А.Л., Игнатов И.С., Голубев М.Н., Хрящев В.В. Разработка и анализ алгоритма выделения лиц на изображениях // Проектирование и Технология Электронных Средств, 2008. № 2. С. 58-62.
190. Голубев М.Н. Разработка и анализ алгоритмов выделения лиц на изображениях // Материалы 3-й Международной научн.-техн. конф. «Инфокоммуникационные технологии в науке, производстве и образовании» (Инфоком-3). Кисловодск, 2008. С. 277-282.
191. Шмаглит Л.А., Голубев М.Н., Игнатов И.С., Хрящев В.В. Выделение лиц на изображениях в условиях искажений // Докл. 11-й междунар. конф. «Цифровая обработка сигналов и ее применение» (DSPA-2009), Москва, 2009. Т.2. С. 511-514.
192. Yang М.Н., KriegmanD.J., AhujaN., Detecting faces in images: A survey // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002. V. 24, P. 34-58.
193. Hjelmas E., LowB.K., Face detection: A survey // Journal of Computer Vision and Image Understanding, 2001. V. 83, P. 236-274.
194. Голубев М.Н., Шмаглит Л.А., Игнатов И.С., Хрящев В.В. Сравнительный анализ алгоритмов выделения лиц на изображениях // Труды XVII международной научно-технической конференции «Информационные средства и технологии». Москва, 2009. Т.2. С. 20-25.
195. Голубев М.Н., Приоров А.Л., Хрящев В.В. Удаление импульсного шума со случайными значениями импульсов из изображений // Радиотехника, 2010. №5. С. 72-78.
196. Muresan D. D., Parks Т. W. Adaptive principal components and image denoising//Proc. IEEE Int. Conf. Image Processing, 2003. V. 1. P. 101104.
197. Chen Т., Wu H. Adaptive impulse detection using center-weighted median filters // IEEE signal processing letters. 2001. V. 8, № 1. P. 1-3.
198. Апальков И.В., Хрящев В.В. Исследовательская среда PicLab: текущие возможности и перспективы развития // Докл. 10-й межд. конф. «Цифровая обработка сигналов и ее применение». Москва. 2008. Т. 2, С. 467-470.
199. Арляпов С.А., Приоров А.Л., Хрящев В.В. Модифицированный критерий оценки качества восстановленных изображений // Цифровая обработка сигналов. 2006. № 2. С. 27-33.
200. Wallage G. The JPEG Still Picture Compression Standard // Communications of the ACM, 1991. V. 34, №4. P. 31-44.
201. Tomasi C., Manduchi R. Bilateral Filtering for Gray and Color Images // Proc. Int. Conf. on Computer Vision and Pattern Recognition, 1998. P. 839846.
202. Волохов В., Сергеев E. Удаление аддитивного белого гауссова шума из цифровых изображений на основе анализа главных компонент // Тр.конф. ГрафиКон'2010, 2010. С. 342-343.196
203. Голубев М.Н. Анализ искажений при передаче изображений по каналам связи // Сб. конкурсных работ Всероссийского смотра-конкурса научн.-техн. творчества студентов вузов «Эврика-2007». Новочеркасск, 2007. С. 15-17.
204. Зараменский Д.А., Голубев М.Н., Шмаглит JI.A. Уменьшение артефактов блочности в JPEG-изображениях // Сборник трудов 63-й научной сессии, посвященной Дню радио, Москва, 2008. С. 228-230.
205. Vezhnevets V., Sazonov V., Andreeva A. A survey on pixel-based skin color detection techniques // Труды конференции ГрафиКон'2003. 2003. P. 85-92.
206. Wang J., Tan T. A New Face Detection Method Based on Shape Information // Pattern Recognition Letters, 2000, P. 463-471.
207. Alboil A., Torres L., Delp E. An Unsupervised Color Image Segmentation Algorithm for Face Detection Applications. Spain, 2000.
208. Zuo F. Fast Human Face Detection Using Successive Face detectors with Incremental Detection Capability. Eindhoven, the Netherlands, 2002.
209. Garcia C., Tziritas G. Face Detection in Color Images Using Wavelet Packet Analysis // Proc. IEEE Intern. Conf. Multimedia Computing and Systems, Florence, V. I, June 1999, P. 703-708.
210. Garcia C., Tziritas G. Face Detection Using Quantized Skin Color Regions Merging and Wavelet Packet Analysis // Proc. IEEE Intern. Conf. Multimedia Computing and Systems, Florence, 1999. V. 1 №3, P. 264-277.
211. Peer P., Kovac J., Solina F. Human skin colour clustering for face detection // In submitted to EUROCON 2003 International Conference on Computer as a Tool, 2003.
212. Ahlberg J. A system for face localization and facial feature extraction // Tech. Rep. LiTH-ISY-R-2172, Linkoping University, 1999.
213. Fleck M., Forsyth D.A., Bregler C. Finding naked people // In Proc. of the ECCV, 1996, V. 2, P. 592-602.
214. Jordao L., Perrone M., Costeira J., Santos-Victor J. Active face and feature tracking // In Proceedings of the 10th International Conference on Image Analysis and Processing, 1999, P. 572-577.
215. Gomez G., Morales E. Automatic feature construction and a simple rule induction algorithm for skin detection // In Proc. of the ICML Workshop on Machine Learning in Computer Vision, 2002, P. 31-38.
216. Brand J., Mason J. A comparative assessment of three approaches to pixellevel human skin-detection. In Proc. of the International Conference on Pattern Recognition, 2000, V. 1, P. 1056-1059.
217. Gomez G. On selecting colour components for skin detection // In Proc. of the ICPR, V. 2, P. 961-964.
218. Zarit B.D., Super B.J., Quek F.K.H. Comparison of five color models in skin pixel classification // In ICCV'99 Int'l Workshop on recognition, analysis and tracking of faces and gestures in Real-Time systems, 1999, P. 58-63.
219. Schumeyer R., Barner K. A color-based classifier for region identification in video // In Visual Communications and Image Processing 1998, 1998, SPIE, V. 3309, P. 189-200.
220. Sigal L., Sclaroff S., Athitsos, V. Estimation and prediction of evolving color distributions for skin segmentation under varying illumination // In
221. Proc. IEEE Conf. on Computer Vision and Pattern Recognition, 2000, V. 2, P. 152-159.
222. Soriano M., Huovinen S., Martinkauppi B., Laaksonen M. Skin detection in video under changing illumination conditions // In Proc. 15th International Conference on Pattern Recognition, 2000, V. 1, P. 839-842.
223. Birchfield S. Elliptical head tracking using intensity gradients and color histograms // In Proceedings of CVPR '98, 1998, P. 232-237.
224. Jones M.J., Rehg J.M. Statistical Color Models with Application to Skin Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1999, V. 1,P. 274-280.
225. Chai D., Bouzerdoum A. A bayesian approach to skin color classification in YCbCr color space // In Proceedings IEEE Region Ten Conference (TENCON'2000), 2000, V. 2, P. 421-424.
226. Trees H.L.V. Detection, Estimation, and Modulation Theory // Wiley V.I., 1968.
227. Brown D., Craw I., Lewthwaite J. A SOM based approach to skin detection with application in real time systems // In Proc. of the British Machine Vision Conference, 2001.
228. Menser B., Wien M. Segmentation and tracking of facial regions in color image sequences // In Proc. SPIE Visual Communications and Image Processing, 2000, P. 731-740.
229. Hsu R.-L., Abdel-Mottaleb M., Jain A.K. Face detection in color images // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002, 24, 5, P. 696706.
230. Yang M.-H., Ahuja N. Detecting Human Faces in Color Images // Proc. IEEE Int'l Conf. Image Processing, 1998, V. 1, P. 127-130.
231. Saber E., Tekalp A.M. Frontal-View Face Detection and Facial Feature Extraction Using Color, Shape and Symmetry Based Cost Functions // Pattern Recognition Letters, 1998, V. 17, № 8, P. 669-680.
232. Yang M.-H., Ahuja N. Gaussian Mixture Model for Human Skin Color and Its Application in Image and Video Databases // Proc. SPIE: Storage and Retrieval for Image and Video Databases VII, 1999, V. 3656, P. 458466.
233. Phung S.L., Bouzerdoum A., Chai D. A novel skin color model in YCbCr color space and its application to human face detection // In IEEE International Conference on Image Processing (ICIP'2002), 2002, V. 1, P. 289-292.
234. Lee J.Y., Yoo S.I. An elliptical boundary model for skin color detection // In Proc. of the 2002 International Conference on Imaging Science, Systems, and Technology, 2002.
235. Yang J., Lu W., Waibel A. Skin-color modeling and adaptation // In Proceedings of ACCV 1998, 1998, P. 687-694.
236. Stern H., Efros B. Adaptive color space switching for face tracking in multi-colored lighting environments // In Proc. of the International Conference on Automatic Face and Gesture Recognition, 2002, P. 249-255.
237. Storring M., Andersen H. Skin colour detection under changing lighting condition // In Araujo and J. Dias (ed.) 7th Symposium on Intelligent Robotics Systems, 1999, P. 187-195.
238. Martinkauppi B., Laaksonen M., Soriano M. Behavior of skin color under varying illumination seen by different cameras at different color spaces // In Machine Vision Applications in Industrial Inspection IX, Proceedings of
239. SPIE, 2001, V. 4301, P. 102-112.200
240. Голубев М.Н., Апальков И.В. Устранение ложных срабатываний в алгоритме выделения лиц на изображении // Докл. 12-й междунар. конф. «Цифровая обработка сигналов и ее применение» (Б8РА-2010), Москва, 2010. Т.2. С. 302-304.
241. Шмаглит Л.А., Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на изображениях // Материалы 20-й Международной Конференции по Компьютерной Графике и Зрению «ГрафиКон'2010», 2010. С. 331-332.
242. Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на базе бустинга // Сб. науч. труд. 13-й всероссийской научно-технической конф. «Нейроинформатика-2011», Москва, 2011. Ч. 3. С. 55-62.
243. Голубев М.Н., Павлов Е.А. Разработка и анализ алгоритмов распознавания лиц на изображениях в программной среде РюЬаЬ // Тезисы докладов XVII Международной студенческой конференции-школы-семинара-М.: МИЭМ, 2009. С. 140-141.
244. Голубев М.Н., Хрящев В.В., Шмаглит Л.А. Об одном алгоритме распознавания лиц на изображениях // Тр. междунар. науч.-техн. конф. «Проблемы автоматизации и управления в технических системах», Пенза, 2009. С. 358-362.
245. Апальков И.В., Голубев М.Н., Игнатов И.С. Архивирование изображений на основе стандарта 1РЕ02000 с возможностью распознавания лиц // Тр. ЬХУ науч. сессии, посвященной Дню Радио. Москва, 2010. С. 207-209.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.