Исследование и моделирование бионических принципов идентификации и контекстного описания изображений

Шапошников, Дмитрий Григорьевич

Исследование и моделирование бионических принципов идентификации и контекстного описания изображений тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Шапошников, Дмитрий Григорьевич

Шапошников, Дмитрий Григорьевич
кандидат технических наук
2002

Специальность ВАК РФ05.13.18

Количество страниц 121

Шапошников, Дмитрий Григорьевич. Исследование и моделирование бионических принципов идентификации и контекстного описания изображений: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Ростов-на-Дону. 2002. 121 с.

Оглавление диссертации кандидат технических наук Шапошников, Дмитрий Григорьевич

Введение

Глава 1. Современное состояние проблемы инвариантного описания и распознавания изображений (Обзор литературы)

1.1. Общие подходы к решению проблем распознавания образов

1.1.1. Классические подходы

1.1.2. Бионический подход

1.2. Методы описания изображений

1.2.1. Признаковое описание изображений

1.2.2. Детектирование фрагментов изображений для детальной обработки

1.3. Постановка задач исследования

Глава 2. Разработка алгоритмов для контекстного описания локальных признаков изображений

2.1. Алгоритмы выделения локальных признаков изображений

2.2. Исследование свойств зрительного восприятия в периферическом поле зрения человека

2.3. Алгоритм контекстного описания

Глава 3. Разработка алгоритмов и методов идентификации и классификации наиболее информативных областей

3.1. Алгоритмы и процедуры каскадного метода идентификации наиболее информативных областей на изображениях лиц

3.1.1. Выделение первичных признаков

3.1.2. Построение частных признаковых карт

3.1.3. Построение итоговой карты

3.1.4. Группирование "точек интереса"

3.1.5. Классификация "областей интереса"

3.1.6. Результаты тестирования метода

3.2. Алгоритмы и процедуры идентификации наиболее информативных областей на изображениях дорожных знаков

3.2.1. Определение цвета и формы внешнего контура знаков

3.2.2. Определение центра информативной части знаков

Глава 4. Разработка модели распознавания изображений на основе идентификации наиболее информативных областей

4.1. Общая схема модели

4.2. Система распознавания изображений лиц

4.3. Система распознавания изображений дорожных знаков 5. Заключение

Выводы

Введение диссертации (часть автореферата) на тему «Исследование и моделирование бионических принципов идентификации и контекстного описания изображений»

Важной проблемой при создании технических систем обработки визуальной информации является инвариантное распознавание изображений по отношению к изменению масштаба, повороту, условиям освещения, уровню сигнал-шум и т.д. [5, 25, 62, 150]. В рамках этой проблемы можно выделить несколько принципиальных аспектов, связанных с разработкой алгоритмов, устойчивых к широкому диапазону преобразований изображений, поиском способов для необходимой и достаточной детализации описания изображений и минимизацией вычислительных затрат.

В настоящее время при решении задач сжатия зрительной информации и инвариантного распознавания изображений интенсивно развивается подход, основанный на разработке вычислительных алгоритмов, имитирующих принципы работы реальных зрительных систем (бионический подход), который рассматривается как наиболее перспективный [27, 73, 74, 76, 77, 136]. В рамках бионического подхода особое внимание уделяется разработке алгоритмов и методов определения наиболее информативных областей (НИО) изображений для детальной обработки, как аналогов биологических механизмов выбора перцептуально важных фрагментов при осмотре изображений [71]. Очевидно, что детальная обработка не всего изображения, а отдельных его фрагментов, может существенно уменьшить вычислительные затраты и увеличить эффективность распознавания. Однако, имеющиеся в настоящее время факты и представления о механизмах зрительного восприятия в биологических системах, неполны и недостаточно формализованы для того, чтобы быть детально воспроизведенными в системах искусственного зрения. Кроме того, известные в литературе методы идентификации НИО не обладают свойством инвариантности и/или требуют большого объема вычислений [1, 33, 53, 75, 110, 117]. Поэтому решение задач поиска эффективных алгоритмов детектирования НИО для разных типов изображений по-прежнему остается актуальным [17, 67, 133, 144, 152].

Принципиально важным остается также и поиск алгоритмов, обеспечивающих сжатое и вместе с тем специфичное описание фрагментов изображений при сохранении инвариантности к различным трансформациям. Одним из широко используемых методов инвариантного описания является представление изображения на нескольких уровнях разрешения [6, 37, 63, 102, 142, 146]. Однако на низких уровнях разрешения может происходить потеря специфических деталей изображения. С другой стороны, алгоритмы, использующие детальное описание каждого фрагмента изображения, становятся очень чувствительными к различным искажениям и требуют больших вычислительных затрат [58, 64, 80, 81, 125].

Данная работа преемственно связана с исследованиями, проведенными ранее в лаборатории нейроинформатики сенсорных и моторных систем НИИ нейрокибернетики им. А.Б. Когана РГУ, в частности с поведенческой моделью распознавания полутоновых изображений [20, 134, 136], и направлена на поиск эффективных алгоритмов идентификации, классификации, описания и распознавания изображений различных классов на основе свойств их наиболее информативных областей.

Особенности подхода, использованного при решении этих проблем, состоят в следующем: тесная связь модельных [21, 30, 45], нейрофизиологических [50, 70, 132] и психофизических [69, 71, 140] исследований; использование бионических принципов для увеличения эффективности распознавания и минимизации вычислительных процедур; применение в качестве первичных одних и тех же локальных признаков и их комбинаций, выделение которых не требует сложных вычислений. Цель и задачи исследования. Целью работы является разработка и исследование бионических алгоритмов и методов идентификации, классификации и контекстного описания информативных областей изображений, а также создание модели распознавания образов и применение ее в задачах инвариантного распознавания изображений лиц и дорожных знаков.

В процессе работы решались следующие задачи:

1. Разработка алгоритмов идентификации и контекстного описания НИО изображений различных типов.

2. Разработка алгоритмов классификации изображений на основе геометрических свойств НИО.

3. Тестирование разработанных алгоритмов в вычислительных экспериментах для выбора их параметров и оценки диапазона инвариантности к различным преобразованиям изображений.

4. Разработка программно-аппаратного стенда и проведение верификационных психофизических экспериментов по исследованию возможных механизмов выбора точек фиксации взгляда.

5. Создание модели распознавания образов и ее тестирование на примере изображений лиц и дорожных знаков.

Научная новизна результатов исследования. Разработан комплекс новых эффективных алгоритмов и методов идентификации НИО и классификации на основе их свойств изображений различных типов. Впервые показано, что для НИО характерны специфические комбинации первичных признаков, таких, например, как разно-ориентированные локальные перепады яркости, выделенные на разных уровнях разрешения. Алгоритм классификации в соответствии с видом изображений, их фрагментов и ракурсом основан на оценке распределения ориентированных элементов, выделенных в пределах НИО, и на оценке пространственного расположения этих областей.

Разработана оригинальная модель инвариантного распознавания изображений лиц и дорожных знаков, основанная на специфичном описании НИО в виде признаковых векторов, формирующихся с помощью пространственно-неоднородного сенсора с контекстным описанием признаков в каждом узле.

На качественном уровне получено экспериментальное подтверждение гипотез компьютерного моделирования о наличии локальной пространственной неоднородности остроты зрительного восприятия в периферическом поле зрения человека. Результаты, полученные в психофизических экспериментах, использованы при разработке алгоритма контекстного описания изображений. Практическая значимость. Разработанные алгоритмы, модели и программы могут быть использованы для решения различных прикладных задач инвариантного распознавания изображений лиц и дорожных знаков, в частности, в системах идентификации личности и системах автоматического управления автомобилем.

Результаты работы использованы при выполнении гранта РФФИ N 98-0100948 и проекта российско-английского сотрудничества между НИИ нейрокибернетики РГУ и Мидлсексским университетом (Великобритания) "Разработка бионических моделей зрения для распознавания реальных изображений".

По результатам имитационных экспериментов разработаны рекомендации для модификации геометрических свойств предупредительных дорожных знаков.

Апробация работы. Результаты работы представлялись на Международной конференции по нейронным сетям "IJCNN'99" в 1999 г. (г. Вашингтон, США); на Международном совещании по возможностям нейрокомпьютинга в 1999 г. (г. Вашингтон, США); на двух Международных конференциях по нейрокибернетике в 1999 г. и 2002 г. (г. Ростов-на-Дону, Россия); на 5-й и 6-й Международных конференциях "Распознавание образов и анализ изображений" в 2000 г. и 2002 г. (г. Самара, г. Великий Новгород, Россия); на 1-й, 2-й и 4-й Всероссийской конференции "Нейроинформатика" в 1999 г, 2000 г и 2002 г (г. Москва, Россия); на семинаре РАСНИ в 2001 г. (г. Москва, Россия); на VIII Всероссийской конференции "Нейрокомпьютеры: разработка и применение" в 2002 г. (г. Москва, Россия); на конференциях молодых ученых в 1996-1999 г (г.Ростов-на-Дону, Россия); на школе-семинаре "Нейроинформатика, нейрокибернетика, нейрокомпьютеры" по программе "Интеграция" в 1998г. (г.Ростов-на-Дону, Россия); на Российско-финской зимней школе-семинаре "Information transfer, data and bio-organisms: from language to behavior" в 2000г. г. Хельсинки, Финляндия); на семинаре Лаборатории вычислительного эксперимента в 2002 г. (ЮГИНФО РГУ, г. Ростов-на-Дону); на заседании Санкт-Петербургского физиологического общества им. И.М. Сеченова в 2002 г. (Институт физиологии им. И.П.Павлова РАН, г. Санкт-Петербург). Публикации. По теме диссертации опубликовано 34 работы, из них 2 в международных журналах, 2 в российских журналах, 18 в тезисах международных конференций, 9 в тезисах российских и студенческих конференций, 2 в различных сборниках и 1 депонирована в ВИНИТИ. Положения, выносимые на защиту.

1. Алгоритм признакового описания, состоящий в представлении фрагмента изображения в виде вектора локальных признаков, заполняемого с помощью пространственно-неоднородного сенсора с учетом свойств признаков, выделенных в контекстной области каждого его узла.

2. Каскадный метод идентификации НИО, включающий комплекс последовательно реализуемых алгоритмов и процедур, основанных на выделении специфических комбинаций первичных признаков, характерных для этих областей.

3. Модель распознавания изображений лиц и дорожных знаков, основанная на идентификации НИО и их контекстном описании с помощью пространственно-неоднородного сенсора.

Структура и объем диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы, двух приложений и изложена на 121 странице, содержит 28 рисунков и 5 таблиц; список литературы включает 158 наименований.

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Шапошников, Дмитрий Григорьевич

Выводы

1. Разработан и исследован алгоритм признакового описания, состоящий в представлении фрагмента изображения в виде вектора локальных признаков, заполняемого с помощью пространственно-неоднородного сенсора с учетом свойств контекстной области каждого его узла. Алгоритм обеспечивает одновременно специфичность и инвариантность отображения фрагментов изображений в некотором диапазоне их преобразований (изменение масштаба - уменьшение и увеличение в 2 раза от исходного размера; поворот - в пределах 22°; ракурс - от 5° до 30°; уровень шума - до 50% при эмуляции функцией Гаусса)

2. Разработан и исследован каскадный метод идентификации НИО, включающий комплекс последовательно реализуемых алгоритмов и процедур, основанных на выделении специфических комбинаций первичных признаков, характерных для этих областей. Метод обеспечивает идентификацию НИО с точностью 95%.

3. Разработан и исследован алгоритм классификации изображений данного типа, базирующийся на геометрических свойствах НИО, таких как форма и пространственное расположение, и обеспечивающий классификацию изображений на подгруппы с высокой точностью (для изображений лиц -96%, для изображений знаков - 98%).

4. Разработана модель распознавания лиц (распознавание на уровне 90%), основанная на идентификации НИО и их контекстном описании с помощью пространственно-неоднородного сенсора, а также на классификации базы изображений в соответствии с ракурсом.

5. Разработана модель распознавания дорожных знаков (распознавание на уровне 96%), основанная на одной фиксации пространственно-неоднородного сенсора в центре информативной части знака и классификации по цвету и форме внешнего контура

5. Заключение

В результате проведенного исследования разработаны алгоритмы идентификации, классификации и описания информативных областей изображений. Модель распознавания образов, аккумулирующая наиболее эффективные из разработанных алгоритмов, обеспечивает сжатое и специфичное описание изображений, а также их распознавание инвариантно к основным геометрическим преобразования (изменению масштаба, сдвигу и повороту) и зашумлению. В основе этих свойств лежит формирование инвариантных признаков для описания фрагментов изображений (49-и мерные вектора как инвариантные признаки первого рода) и изображений в целом (пространственные отношения между НИО как инвариантные признаки второго рода).

Представленные результаты психофизических экспериментов свидетельствуют о локальной неоднородности сенсорной настройки в периферическом поле зрения. Они подтверждают следствие имитационного моделирования [20, 134, 136] и позволяют по-новому взглянуть на механизмы анализа информации в периферическом поле зрения.

Известные данные [50, 70, 132] свидетельствуют о том, что распределение рецепторов от центра сетчатки к периферии, апроксимирующееся, в среднем, экспонентой, имеет локальные максимумы и минимумы. По-видимому, микрообласти с высокой остротой сенсорной настройки в периферическом поле зрения ("микрофовеа"), обслуживаются участками сетчатки, где расположены локальные группы рецепторов. Напротив, микрообласти с низкой сенсорной настройкой ("функциональные микроскотомы") связаны с участками сетчатки с низкой плотностью рецепторов.

Обнаруженная пространственная неоднородность сенсорной настройки может отражать базовые механизмы контекстного кодирования фовеапьной информации, определяемые структурной организацией зрительной сенсорной системы, и вносить вклад в формирование приоритета выбора точек фиксации на этапе зрительного восприятия, предшествующем оценке перцептуальной важности фрагментов изображения.

Данные о распределении микрообластей с высокой и низкой остротой сенсорной настройки позволили разработать алгоритмы описания локальных признаков изображений в контекстных областях узлов пространственно-неоднородного сенсора в модели распознования образов и формирования одновременно специфичного и инвариантного представления НИО.

Проведенное исследование показало, что каскадный метод обеспечивает относительно высокий коэффициент избирательности детекции НИО изображений лиц независимо от ракурса и размера. Причем, выявленное распределение точек интереса по разным НИО (Рисунок 5.1) коррелирует с известными психофизическими данными [71] о распределении точек фиксации взгляда при осмотре изображений лиц. Это косвенно подтверждает предположение [17] о том, что НИО имеют комплекс первичных преаттентивных признаков привлекающих зрительное внимание, поскольку каскадный метод был основан на использовании элементарных первичных признаков (ориентация локальных перепадов яркости) и их комбинаций.

Вероятно, выявленная инвариантность детектирования НИО лиц к изменениям ракурса и размера изображения в значительной мере определяется выбором в качестве устойчивого признака относительной ориентации между центральным и периферическими перепадами яркости в локальных фрагментах изображения. Из полученных результатов следует, что выбранная комбинация локальных признаков (интервал относительных углов от 90° до 270°) является инвариантной к ракурсу лиц одной и той же персоны на изображениях (в диапазоне ±30° при горизонтальном повороте и ± 15° - при вертикальном).

94 а б

Рисунок 5.1. Примеры распределения точек фиксации взгляда (а) при осмотре изображения лица [71] и "точек интереса" (б), выделенных с помощью каскадного метода.

Разработанный алгоритм, помимо решения проблемы инвариантности выявления НИО как зон концентрации потенциальных "точек интереса", имеет ряд преимуществ по сравнению с известными подходами и методами детектирования НИО. В частности, для предложенного алгоритма характерны следующие свойства:

1) высокая избирательность детектирования НИО. В среднем, менее 5% выявленных точек интереса расположено вне НИО, что превышает точность, получаемую с помощью других методов (см., например, [133, 144]);

2) простота и высокая скорость вычислений. В частности, итоговая карта для одного изображения вычисляется за 0,5 сек. на стандартном Pentium 200/32 (без учета предварительной обработки), тогда как время предобработки составляет на том же комьютере (без специальных устройств) 6 сек.;

3) возможность распараллеливания основных вычислений для получения множественных частных и итоговой признаковых карт;

4) описанные алгоритмы и процедуры основаны на одних и тех же базовых вычислениях и не требуют большой вычислительной мощности, в отличии от известных [33, 128,146];

5) возможность использования получаемых результатов для последующей детальной обработки НИО лиц с помощью различных стандартных и специальных методов, в том числе биометрических [53].

В этом отношении важно, что каждая из НИО выявляется как относительно дискретная зона концентрации точек интереса. Это позволяет определить взаимное расположение НИО на произвольном изображении лица и оценить ракурс и размер изображения.

Тестирование показало, что разработанные алгоритмы оценки параметров изображений на основе НИО позволяют с высокой вероятностью определять ракурс поворота лица на изображении.

Каскадный метод и алгоритм контекстного описания НИО были интегрированы в систему распознаваний изображений лиц, что позволило увеличенить эффективность обработки изображений на этапах запоминания и распознавания по сравнению с предыдущей моделью распознавания лиц, разработанной в лаборатории [20, 134, 136]. Сопоставление результатов тестирования разработанной модели при распознавании изображений лиц с описанными в литературе позволяет сделать следующие выводы:

1. Разработанная система обеспечивает точность распознавания для базы изображений ORL не ниже, чем известные системы, основанные на методе главных компонент [115, 158] и объемного частотного представления [79], и уступает системам, основанным на нейросетевом подходе [4, 106, 112, 113, 146]. Однако, высокая точность распознавания, получаемая с помощью нейросетевых алгоритмов, связана с поиском устойчивых статистических характеристик в спектре входных изображений данной персоны, что требует достаточно продолжительной стадии обучения, приводящей к многочасовой обработке эталонных изображений.

2. Модель в отличие от систем, основанных на методе главных компонент и нейросетевом подходе [149], позволяет дополнять ранее полученные описания персон без необходимости повторного обучения на новой объединенной выборке эталонных изображений.

3. Описания, получаемые по эталонным изображениям в нашей модели, не чувствительны к точному позиционированию в отличие от известных систем [125, 130].

Представленная в данной работе модель распознавания дорожных знаков включает в себя алгоритмы сегментации из внешнего фона, классификации знаков в соответствии с цветом и формой внешнего контура, определения центра знака для позиционирования пространственно-неоднородного сенсора, контекстного описания локальных признаков и сопоставления векторов, описывающих текущие и базовые изображения. Разработанные алгоритмы позволили существенно увеличить точность распознавания по сравнению с предыдущей версией модели [99] (с 87% до 96%).

В отличие от методов, основанных на полном описании знаков [100, 101, 122, 151], разработанный подход, основанный на преимущественной обработке информативных областей знака на высоком уровне разрешения (до 90% информативной части знака представляется на 1-ми 2-м уровнях разрешения) и их контекстном описании, обеспечивает одновременно сжатое (в среднем, в 16 раз) и инвариантное описание изображений. Очевидно, такое представление исходного изображения лежит в основе эффективного распознавания, устойчивого к трансформациям изображений в реальных условиях дорожного движения, в частности, при распознавании дорожных знаков, полученных при съемке в различных погодных условиях и с разных рядов движения.

При этом, знаки, снятые с расстояния до 50 м и имеющие заслонение не более 50% от площади информативной части, распознаются с вероятностью 0,99. Следует отметить также значительную роль процедуры классификации в обеспечении высокой точности распознавания. В частности, без этой процедуры для тех же изображений точность распознавания падает до 86%.

Для практического применения разработанные алгоритмы могут быть оптимизированы. В частности, повышение эффективности распознавания с помощью модели без потери ее основного свойства - инвариантности к трансформациям изображений - может быть достигнуто за счет увеличения специфичности описания локальных признаков в информативной части знака, а также с помощью классификации знаков не только по цвету и форме внешнего контура, но и по их внутреннему содержанию.

98

Список литературы диссертационного исследования кандидат технических наук Шапошников, Дмитрий Григорьевич, 2002 год

1. Абламейко C.B., Лагуновский Д.М. Обработка изображений: технология, методы, применение. Минск: Амалфея, 2000. - 304с.

2. Александров В.В., Горский Н.Д. Представление и обработка изображений: Рекурсивный подход. Л.: Наука, 1985. - 192с.

3. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. М. Мир, 1982. - 488с.

4. Байдык Т.Н. Нейронные сети и задачи искусственного интеллекта. Киев: Наукова Думка, 2001. - 263с.

5. Балухто А. Н., Галушкин А.И. Нейрокомпьютеры в системах обработки изображений. М: Радиотехника, 2002.

6. Берт П. Д. Интеллектуальное восприятие в пирамидальной зрительной машине. // ТИИЭР. 1988. - Т.76. - 8. - с. 175-186.

7. Ванагас В.А. Принцип активного многоуровневого узнавания зрительных изображений. / Зрительные системы. Вильнюс: Изд-во Вильнюсского университета, 1987. -с.46-74.

8. Вапник В.Н., Червоненкие А .Я. Теория распознания образов (статистические проблемы обучения). М.: Наука, 1974. - 415с.

9. Васильев Ф.П. Численные методы решения экстремальных задач. -М.: Наука, 1980, 520с.

10. Введение в контурный анализ и его приложения к обработке изображений и сигналов. / Под редакцией Фурмана Я.А. -М.: Физматлит, 2002. 592с.

11. Владимирский Б.М. Математические методы в биологии. Ростов-на-Дону: Изд. Ростовского у-та, 1983. - 304с.

12. Гаврилей Ю.К., Самарин А.И., Шевченко М.А. Активный анализ изображения в системах с фовеальным сенсором. Нейрокомпьютеры: разработка и применение. 2002. - 7-8. - с.34-46.

13. Генкин В.Л. и др. Системы распознавания автоматизированных производств. / В.Л.Генкин, И.Л. Ерош, Э.С. Москалев. Л.: Машиностроение. Ленингр. отд-ние, 1988. - 246 с.

14. Гибсон Дж. Экологический подход к зрительному восприятию. Пер. с англ. -M.: Прогресс, 1988. 462с.

15. Глазунов A.C. и др. Компьютерное распознавание человеческих лиц. / Зарубежная Радиоэлектроника. Успехи современной радиоэлектроники. -1997.-8 .-с.3-14.

16. Глезер В.Д. Механизмы опознавания зрительных образов. Л., 1966. -204с.

17. Головань A.B., Шевцова H.A., Подладчикова JI.H., Маркин С.Н., Шапошников Д.Г. Детектирование информативных областей лиц с помощью локальных признаков. // Нейрокомпьютеры: разработка и применение. 2001. - 1. - с.50-57.

18. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 1984.-208с.

19. Грегори К. Использование Visual С++ 5. Киев-Москва: Диалектика, 1997. -816с.

20. Гусакова В.И., Шапошников Д.Г., Подладчикова Л.Н. Возможные механизмы осмотра изображений: модель и эксперимент. // Первая всероссийская научно-техническая конференция "Нейроинформатика-1999": Тез.док. -М., 1999. -т.2. с.148-154.

21. Доберши И. Десять лекций по вейвлетам. Пер. с англ. Ижевск: НИЦ Регулярная и хаотическая динамика, 2001. - 464с.

22. Дуда Р., Харт П. Распознавание образов и анализ сцен. Пер. с англ. М.: Мир, 1976.-511с.

23. Дьяконов В.П. Вейвлеты. От теории к практике. М.: СОЛОН-Р, 2002. -448с.

24. Журавлев Ю.И. Избранные научные труды. М.: Издательство Магистр, 1998.-420с.

25. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений. // Искусственный интеллект. Том 2 Модели и методы / Под редакцией Д.А. Поспелова. М.: Радио и связь, 1990. - с. 149-191.

26. Завалишин Н.В. Мучник И.Б. Модели зрительного восприятия и алгоритмы анализа изображений. М.: Наука, 1974. - 334с.

27. Ивахненко А. Г. Самообучающиеся системы распознавания и автоматического регулирования. К.: "Наукова думка", 1969 - 349 с.

28. Иконика. Цифровая обработка видеоинформации. М.: Наука, 1989. -128с.

29. Исследование и моделирование нейронных механизмов объектного зрительного восприятия: Отчет о НИР (итоговый) / Руководитель Л.Н. Подладчикова. № гос. регистрации 01.200.2 04992. - Ростов-на-Дону, 2001.-20 с.

30. Ковалевский В.А. Методы оптимальных решений в распознавании изображений. -М.: Наука, 1976. 328 с.

31. Корн Г., Корн Т. Справочник по математике. М: Наука, 1968. - 720с.

32. Костин А., Киттлер Д. Метод опорных векторов для быстрого поиска лиц и координат глаз на изображении. / 6-я межд. конф. РОАИ-6-2002, тр. конф. Великий Новгород, 2002. - т.1. - с.316-320.

33. Кохонен Т. Асоциативные запоминающие устройства. М.:Мир, 1982. -383 с.

34. Круг Г.К., Кабанов В.А., Фомин Г.А, Фомина Е.С. Планирование эксперимента в задачах нелинейного оценивания и распознавания образов. -М: Наука, 1981.- 172 с.

35. Купер Дж., Макгилем К. Вероятностные методы анализа сигналов и систем. Пер. с англ. М.: Мир, 1989. - 376 с.

36. Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. Пер. с англ. М.: Радио и связь, 1987. -400с.

37. Математические методы в распознавании образов и дискретной оптимизации. / Под ред. Ю.И.Журавлева. М.: Вычислительный центр АН СССР, 1987.- 115с.

38. Мешков А., Тихомиров Ю. Visual С++ и MFC. 2-е издание. Санкт-Петербург: 2000. - 1040с.

39. Минский М., Пейперт С. Персептроны. Пер. с анг. М.Мир, 1971. - 263с.

40. Мовчан В.П., Попов В.В., Кузьмин Д.П., Буруди А.И. Аппаратно-программный комплекс идентификации номерных знаков движущихся в потоке автотранспортных средств. / 5-я межд. конф. РОАИ-5-2000, тр. конф. Самара, 2000. - т.4. - с.789-791.

41. Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука, 1978. - 336 с.

42. Нортон П., Макгрегор Р. Руководство Питера Нортона. Программирование в Windows 95/NT 4 с помощью MFC. В 2-х книгах. М.: СК Пресс, 1998.

43. Нотон Д., Старк JI. Восприятие. Механизмы и модели. М.: Мир, 1974. -С.226-240.

44. Оптико-электронные метода обработки изображений. / Под ред. С.Б.Гуревича, Г.А.Гаврилова. Л.: Наука, 1982. - 208с.

45. Очин Е.Ф. Вычислительные системы обработки изображений. Л.: Энергоатомиздат. Ленингр. Отд-ние, 1989. - 136 с.

46. Павлидис Т. Алгоритмы машинной графики и обработки изображений. Пер. с англ. -М.: Радио и связь, 1986. 400с.

47. Патрик Э. Основы теории распознавания образов. М.: Советское радио, 1980.-408с.

48. Подвигин Н.Ф., Макаров Ф.Н., Шелепин Ю.Е. Элементы структурно-функциональной организации зрительно-глазодвигательной системы. JL: Наука, 1986. - 252с.

49. Покровский А.Н. Электрические измерения как источник информации об организации нейронных сетей. // 12-я Межд. Конф. по Нейрокибернетики: Тез. док. Ростов-на-Дону, 1999. - С.229-231.

50. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. - т. 1. - 310с.

51. Самаль Д.И. Алгоритмы идентификации человека по фотопортрету на основе геометрических преобразований. Автореферат дисс. кантд. техн. наук. Минск, 2002. - 20с.

52. СБИС для распознавания образов и обработки изображений. Пер. с англ. / Под ред. К.Фу. М.: Мир, 1988. - 248с.

53. Секунов Н.Ю. Самоучитель Visual С++ 6. СПб.: БХВ, 2000. - 960с.

54. Тельных A.A., Чайкин A.B., Яхно B.F. Исследование динамических режимов подстройки параметров адаптивной нейроподобной системы. .// Юбилейная Межд. Конф. по Нейрокибернетики: Тез. док. Ростов-на-Дону, 2002. - С.48-49.

55. Техническое зрение роботов. / Под ред. проф. А. Пью, М.: Машиностроение, 1987. -320с.

56. Ту Дж., Гонсалес Р. Принципы распознавания образов. Пер. с англ. М.: Мир, 1978.-411с.

57. Уоссерман Ф. Нейрокомпьютерная техника: Теория и практика. Пер с англ. -М.: Мир, 1992.-240 с.

58. Уэйт М., Прата С., Мартин Д. Язык Си. Руководство для начинающих. Пер. с англ. М.: Мир, 1998. 512с.

59. Фор. А. Восприятие и распознавание образов. / Пер. с фр. A.B. Сердинского; под ред. Г.П.Катыса. М: Машиностроение, 1989. 271с.

60. Фу К., Гонсалес Р., Ли К. Робототехника. Пер. с англ. М.: Мир, 1989. -624с.

61. Цифровая обработка изображений в информационных системах. / И.С. Грузман, B.C. Киричук и др. Новосибирск: Изд.-во НГТУ, 2002. - 352с.

62. Цифровая обработка телевизионных и компьютерных изображений. / Под редакцией Ю.Б.Зубарева и В.П. Дворковича. М.: МЦНТИ, 1997. - 212 с.

63. Чернухин Ю.В. Цифровая нейрокомпьютерная модель зрительного анализатора. / Сб. научных трудов. Многопроцессорные вычислительные структуры. 1991. - вып. 13. - с.42-49.

64. Шадрин А. В., Яхно В. Г. Алгоритм выделения и обхода точек внимания на сложном изображении // Изв. вузов, Радиофизика. 1994. -т.37. - 9. -с.1173 - 1194.

65. Шапошников Д.Г., Гусакова В.И., Подладчикова JI.H. Методика исследования сенсорных механизмов перевода взгляда. // РГУ. -Ростов-на-Дону, 1997. 14с. - Деп. в ВИНИТИ 19.12.97, 3697.

66. Шибкова С.А. Нейронное строение внутреннего отдела сетчатки позвоночных. Дисс. док. биолог наук. - Ростов-на-Дону, 1971. - 543с.

67. Ярбус А.Л. Роль движений глаз в процессе зрения. М.: Наука, 1965. -166с.

68. Ahrns, I., Neumann, Н. Space-Variant Image Processing. // Proc. in Artificial Intelligence, 2000. 9. - p.203-206.

69. Aloimonus J., Weiss I., Bandyopadhyay A. Active vision. // Proc. of the Int. Joint Conf. on Computer Vision, 1987. p.35-54.

70. Bajcsy R. Active perception. // Proc. of the IEEE, 1988. V.76. - P.996-1005.

71. Bala J.W., Wechsler H., Vafaie H., Huang J. and DeJong K. Visual Routine for Eye Detection Using Hybrid Genetic Architectures. // Proc. of 13th Int. Conf. on Pattern Recognition. Vienna, 1996. - p.606-610.

72. Ballard D.H. Cortical connections and parallel processing: Sructure and function. // The behavioral and brain sciences. 1986. - v.9. - p.67-120.

73. Bandera C., Scott, P. Machine vision for pursuit. The foveal alternative. // Journal of Electronic Defense. 1991. - v. 14. - 10. - p.61-66.

74. Baratoff G., Schonfelder R., Ahrns I., Neumann H. Orientation contrast detection in space-variant images. // Proc. of Biologically Motivated Computer Vision Workshop. Seoul, 2000. p.554-563.

75. Ben-Arie J., Nandy D. A volumetric/iconic frequency domain representation for objects with application for pose invariant face recognition. // IEEE Transaction on Pattern Analysis and Machine Intelligence, 1998. v.20. - 5. - p.449-457.

76. Ben-Yacoub S., Luettin J., Jonsson K., Matas J., Kittler J. Audio-visual person verification. // Conf. on Computer Vision and Pattern Recognition: Proc. IEEE Computer Society, 1999. p. 580-585.

77. Buhmann J., Lange J., and C. von der Malsburg. Distortion invariant object recognition by matching hierarchically labeled graphs. // Proc. Int. Joint Conf. on Neural Networks, 1989. v. 1. - p. 155-159.

78. Burl M.C., Leung T.K. and Perona P. Face Localization via Shape Statistics. // Proc of the Int. Workshop on Automatic Face and Gesture Recognition. Zurich, 1995. - p.154-159.

79. Campos T. E., R. S. Feris, R. M. Cesar Jr. Eigenfaces versus Eigeneyes: First Steps Toward Performance Assessment of Representarions for Face Recognition. // Lecture Notes in Artificial Intelligence. Springer-Verlag press, 2000. v.1793. -p. 197-206.

80. Chen L.F., Liao H.M., Lin J. and Han C. Why Recognition in a statistic-based Face Recognition System should be based on the pure Face Portion: A Probabilistic decision-based Proof. // Pattern Recognition. 2001. - v.34. - 7. -p. 1393-1403.

81. Cho K.-B., Sheu B.J., Young W.C. Biologically inspired image sensor/processor architecture with 2-D cellular neural network for vision. // Proc. of IEEE Conf. on Computer Vision and Pattern Recognition, 1998. 1. - p. 574-596.

82. Christou C. and Bulthoff H.H. Perception, representation and recognition: A holistic view of recognition. // Spatial Vision. 2000. -v. 13. -2/3. - p.265-275

83. C1E, The CIE 1997 Interim Colour Appearance Model (Simple Version), CIECAM97s. // CIE TC1-34, 1998.

84. CRIM. Report of Sub-Project 1.2 of Geometry Modeling: Equipment Selection for Image Acquisition, July, 1995.

85. Dail D.Q., G.Can, J.H. Lai, P. C. Yuen. Face Recognition Based on Local Fisher Features // T. Tan, Y. Shi, and W. Gao (Eds.): ICMI 2000, LNCS 1948, 2000. -p.230-236.

86. Daugman J. Face Detection: A Survey. // Computer Vision and Image Understanding. 2001. - V.83. - 3. - p.236-274.

87. Di Gesu V., Valentini C., Strinati L. Local operators to detect region of interest. // Pattern Pecognition Letters. 1997. - 18. - p. 1077-1081.

88. Donato G., M. S. Bartlett, J. C. Hager, P. Ekman, and T. J. Sejnowski. Classifying facial actions. // IEEE Transaction on Pattern Analysis and Machine Intelligence. 1999. - v.21. - 10. - p.974-989.

89. Efron R., Yund E.W. Spartial nonuniforrrrities in visual search. // Bain and Cognition. 1996. - 31. - p.331-368.

90. Elliffe M., Rolls E., Parga N., Renart A. A recurrent model of transformation invariance by association. // Neural Network. 2000. - v.13. - p.225-237.

91. Essa I. A., Pentland A.P. Coding, analysis, interpretation and recognition of facial expressions. // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997. -v.19. 7. - p.757-763.

92. Franco A., Luinini A. and Maio D. A hierarchical approach for face recognition. //Proc. of Workshop on Automatic Identification Advances Technologies, 2002. -p.155-158.

93. Furmanski C. S., Ehgel S. A. Perceptual learning in object recognition: object specificity and size invariance. // Vision Research. 2000. - 40. - p.473-484.

94. Gale A. Human Response to Visual Stimuli. // The Perception of Visual Information, W. Hendee and P. Wells, editors, Springer-Verlag, 1997. p. 127147.

95. Gao X., Shevtsova N., Hong K., Batty S., Podladchikova L., Golovan A., Shaposhnikov D., Gusakova V. Vision Models Based Identification of Traffic Signs. // Proc: The First Euro. Conf. On Color in Graph., Image and Vision, 2002. -p.47-51.

96. Gavrila D. M., Franke U., Gorzig S. and Wohler C. Real-time Vision for Intelligent Vehicles. // IEEE Instrumentation and Measurement Magazine. -2001. -4. -p.22-27.

97. Gavrila D.M. Traffic Sign Recognition Revisited. // Proc. of the 21st DAGM Symposium fur Mustererkennung. Springer Verlag, 1999. p.86-93,

98. Geisler W.S., Perry J.S. A real-time foveated multiresolution system for low-bandwidtli video communication. // Human Vision and Electronic Imaging, SPIE Proceedings. 1998. - n.3299. - p.294-305.

99. Georghiades A.S., Kriegman D.J., Belhumeur P.N. Illumination cones for recognition under variable lighting: faces. // Conf. on Computer Vision and Pattern Recognition: Proc. of IEEE, 1998. n. 6. - p.52-58.

100. Gong S., McKeima S. J., Psarrou A. Dynamic Vision: From Images to Face Recognition. Imperial College Press, 2000. - 364p.

101. Gross R., Yang J., Waibel A. Growing Gaussian Mixture Model for Pose Invariant Face Recognition. // Proc. of the Int. Conf. on Pattern Recognition (ICPR 2000), Barcelona, 2000. v.3. - p.1088-1092.

102. Haddadnia J., Faez K., Ahmadi M. N-feature neural network human face Recognition. // Proc. 15th Int. Conf. on Vision Interface, 2002. p.300-307.

103. Hancock P.J.B., Bruce V., and Burton M.A. A comparison of two computer-based face identification systems with human perceptions of faces. // Vision Research. 1998. - v.38. -15/16. -p.2277-2288.

104. Hecht-Nielsen R., Zhow Y.T. V ART AC: A Foveal Active Vision ART System. // Neural Networks. 1995. - v.8. - 7/8. - p. 1309-1321.

105. Henderson J.M., Falk R., Minut S., Dyer F.C., Mahadevan S. Gaze Control for Face Learning and Recognition by Humans and Machines. // Technical Report, Michigan State University Eye Movement Laboratory, 2000. v.4. - p.1-14.

106. Hjelmas E., Wroldsen J. Recognizing Faces from the Eyes Only. // Proc. of the 11-th Scandinavian Conf. on Image Analysis, 1999. (http ://w3 .hig.no/~erikh/papers/scia99 .pdf.)

107. Hjelmas E., Kee B. Low Face Detection: A Survey. // Computer Vision and Image Understanding. 2001. - v.83. - 3. - p.236-274.

108. Ho Sh-Y., Huang H-L. An analytic solution for the pose determination of human faces from a monocular image. // Pattern Recognition Letter. 1998. - v.19. -p.1045-1054.

109. Huang J., Wechsler H. Eye Detection Using Optimal Wavelet Packets and Radial Basis Functions (RBFs). // Int. J. of Pattern Recognition and Artificial Intelligence. 1999. - v.13. - 7. - p.1009-1026.

110. Hubel D.H., Wiesel T.N. Sequence, regularity and geometry of orientation columns in the monkey striate cortex. // Journal of Comparative Neurology. -1974. v.158. - p.267-293.

111. Hyvarinen A., Oja E. Independent component analysis: algorithms and applications. // Neural Networks. 2000. - 13. - p.411-430.

112. Jagersandy M. Saliency maps and attention selection in scale and spatial coordinates. An information theoretical approach. // Proc. of 5th Int'l Conf. on Computer Vision, 1995. p. 195-202.

113. Jurie F. A new log-polar mapping for space variant imaging. Application to face detection and tracking. // Pattern Recognition. 1999. - 32. - p.865-875.

114. Kalocsai P., von der Malsburg C., Horn J. Face recognition by statistical analysis of feature detectors. // Image and Vision Computing. 2000. - 18. - p.273-278.

115. Kumar V., T. Poggio. Learning based approach to real-time tracking and analysis of faces. // Proc. of the 4-th Int. Conf. on Face and Gesture Recognition, Grenoble, France, 2000. p.91-96.

116. Kurogi S. Competitive neural network for affine invariant pattern recognition. // Proc. of the Int. Joint Conf. on Neural Networks (IJCNN"93), Nagoya, 1993. -v.l. -p.181-184.

117. Lalonde ML, Li Y. Road Sign Recognition Survey of the State of Art. // Tech. rep. for Sub-Project 2.4, CRIM-IIT-95/09-35, (http ://nannetta. ce. unipr. it/argo/thevsav/rs2).

118. Lam K.-M., Yan H. An analytic-to-holistic approach for face recognition based on a single frontal view. // IEEE Transactions on pattern analysis and machine intelligence. 1998. - v.20. - 7. - p.673-686.

119. Lanitis A., Taylor C.J., Cootes T.F. Toward Automatic Simulation of Aging Effects on Face Images. // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2002. - v.24. - 4. - p.442-455.

120. Li S.Z., Lu J. Face Recognition Using the Nearest Feature Line Method. // IEEE Trans. On Neural Networks, 1999. v. 10. -p.439-443.

121. Mario D., Maltoni D. Fast face location in complex backgrounds. // Proc. of Nato Asi Conference on Faces, 1997. p.568-577.

122. Messner R.A., Szu H.H. An image processing architecture for real time generation of scale and rotation invariant patterns. // Computer Vision, Graphics, and Image Processing. 1985. - v.31. - p.50-60.

123. Miao J., Gao W., Chen Y., Lu J. Gravity-Center Template Based Human Face Feature Detection. // T. Tan, Y. Shi, and W. Gao (Eds.): ICMI 2000, LNCS 1948, 2000.-p. 207-214.

124. Miura J., Kanda T., Shirai Y. An Active Vision System for Real-Time Traffic Sign Recognition. // Proc. 2000 IEEE Int. Conf. on Intelligent Transportation Systems, 2000.-p.52-57.

125. Moghaddam B., Wahid W., Pentland A. Beyond eigenfaces: probabilistic matching for face recognition. // Proc. of 3rd IEEE Conf. on Automatic Face & Gesture Recognition, 1998. p. 30-35.

126. Nastar C., Mitschke M. Real-time face recognition using feature combination. // Proc. of 3rd IEEE Conf. on Automatic Face & Gesture Recognition, 1998. -p.312-317.

127. Orban G.A. Neuronal Operations in the Visual Cortex. Studies of Brain Function. Berlin-Heidelberg, N-Y, Tokyo, 1984. - 367p.

128. Osberger W., Maeder A.J. Automatic identification of perceptually important regions in an image. // Proc. 14th Int'l Conf. on Pattern Recognition, Australia, 1998. p.701-704.

129. Rao R.P., Zelinsky G.J., Hayhoe M.M., Ballard D.N. Eye Movements in Visual Cognition: A Computational Study. // Technical Report 97.1. University of Rochester, 1997. (ftp://ftp.cs.rochester.edU/pub/u/rao/papers/tr97.l.ps.Z)

130. Rybak I.A., Gusakova V.I., Golovan A.V., Podladchikova L.N., Shevtsova N.A. A Model of Attention-Guided Visual Perception and Recognition. // Vision Research. 1998. - v.38. - 15/16. - pp.2387-2400.

131. Salgian G., Ballard D. Visual Routines for Autonomous Driving. // Proc. of the 6-thlCCV, 1998. p.876-882.

132. Salvucci, D. D. A model of eye movements and visual attention. // Proc. of the Int. Conf. on Cognitive Modeling. Veenendaal, The Netherlands: Universal Press, 2000. - p.252-259

133. Schwartz E.L., Greve D.N., Bonmassar G. Space-variant Active Vision: Definition, Overview and Examples. // Neural Networks. 1995. - v.8. - 7/8. -p.1297-1308.

134. Shaposhnikov D.G., Gizatdinova Yu.F., Podladchikova L.N. The Peculiarities of the Visual Perception in the Peripheral Vision Field. // Pattern Recognition and Image Analysis. 2001. - v. 11. - 2. - p.376-378.

135. Shaposhnikov D.G., Podladchikova L.N., Golovan A.V., Shevtsova N.A., Hong K., Gao X. Road Sign Recognition by Single Positioning of Space-Variant Sensor Window. // Proc. 15th Int. Conf. on Vision Interface, 2002. -p.213-217.

136. Shneier M. Multiresolution feature encoding. / Multiresolution ImageProcessing and Analysis, A. Rosenfeldt (Ed.), 1984. p. 190-199.

137. Simion F., Cassia ML, Turati V., Valenza C. The Origins of Face Perception: Specific Versus Non-specific Mechanisms. // Infant and Child Development.2001.-v.10.- 1/2.-p.59-66.

138. Smeraldi F., Carmona O., Bigun J. Saccadic Search with Gabor features applied to Eye Detection and Real-Time Head Tracking. // Image and Vision Computing. -2000. v.18. -4. - p.323-329.

139. Stephenson C.M., Knapp A.J., Braddick O.J. Discrimination of spatial phase shows a qualitative difference between foveal and peripheral processing. // Vision Research, -v.31. -7-8. p. 1315-1326.

140. Takacs B., Wechsler H. A Dynamic and Multiresolution Model of Visual Attention and its Application to Facial Landmark Detection. // Computer Vision and Image Understanding. 1998. - v.70. - 1. - p.63-73.

141. Treisman A.M., Gelade G. A Feature Integration Theory of Attention. // Cognitive Psychology. 1080. - v. 12. - p.97-136.

142. Ullman S., Soloviev S. Computation of Pattern Invariance in Brain-like Structures. // Neural Networks. 1999. - v.12. - 7/8. - p.1021-1036.

143. Wang R. A Hybrid Learning Network for Shift-invariant Recognition. .// Neural Networks. 2001. - 14. - p.1061-1073.

144. Wechsler H. Face Recognition: From Theory to Applications. / Springer-Verlag,2002.-921p.

145. Wei G., Sethi I. K., Sarkar S. Traffic Sign Detection and Recognition for Safe Driving. // Intelligent Engineering Systems Through Artificial Neural Networks. -1999.-9.-p.821-826.

146. Weimin H. and Mariani R. Face Detection and Precise Eyes Location. // Proc. of the Int. Conf. on Pattern Recognition (ICPR'00), 2000. p.722-726.109

147. Wiskott L. and Sejnowski T. Slow Feature Analysis: Unsupervised Learning of Invariances. 11 Neural Computation. 2002. - v.14. - 4. - p.715-770.

148. Yow K.C., Cipolla R. Towards an Automatic Human Face Localization System. //Proc. 6th British Machine Vision Conf, Birmingham, 1995. v2. -p.701-710,.

149. Zadeh M. M., Kasvand T., Suen C. Y. Localization and Recognition of Traffic Signs for Automated Vehicle Control Systems. // Proc. of SPIE on Intelligent Transportation System, Pittsburgh, 1997. p.272-282.

150. Zeng X. Attention Mechanism and its Role in Invariant Pattern Recognition. // Neurocomputing. 2001. - 38-40. - p. 1611-1618

151. Zhang Z. Feature-based facial expression recognition: Sensitivity analysis and experiments with a multi-layer perceptron. // Int. Journal of Pattern Recognition and Artificial Intelligence. 1999. - v. 13. - 6. - p.893-911,.

152. Zhao W, Krishnaswamy A., Chellappa R., Swets D.L., and Weng J. Discriminant Analysis of Principal components for Face Recognition. // Face Recognition: From Theory to Applications. Springer-Verlag: 1998. p.73-85.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат технических наук Шапошников, Дмитрий Григорьевич

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Модель системы зрительного распознавания на основе разноракурсных описаний объектов2002 год, кандидат технических наук Бессарабов, Игорь Иванович

Метод распознавания сверхбольших выборок изображений2010 год, кандидат физико-математических наук Пименов, Виталий Юрьевич

Введение диссертации (часть автореферата) на тему «Исследование и моделирование бионических принципов идентификации и контекстного описания изображений»

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Параллельные цифровые нейрокомпьютеры и их применение в задачах распознавания зрительных образов1997 год, доктор технических наук Галуев, Геннадий Анатольевич

Теория и методы морфологического анализа изображений2008 год, доктор физико-математических наук Визильтер, Юрий Валентинович

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Шапошников, Дмитрий Григорьевич

Список литературы диссертационного исследования кандидат технических наук Шапошников, Дмитрий Григорьевич, 2002 год