Разработка алгоритма распознавания сложных объектов на основе текстурной информации тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Яковенко, Максим Константинович
- Специальность ВАК РФ05.13.01
- Количество страниц 145
Оглавление диссертации кандидат технических наук Яковенко, Максим Константинович
Перечень условных обозначений и сокращений.
Введение.
1. Анализ предметной области.
1.1. Описание предметной области.
1.2. Методы дифференцирования лейкоцитов.
Экспертное распознавание.
Автоматическое распознавание.
1.3. Патентный поиск.
1.4. Предлагаемый подход к распознаванию.
1.5. Классификация методов автоматического распознавания клеток.
1.6. Выводы.
2. Параметры классификации клеток.
2.1. Постановка задачи поиска инвариантных признаков.
2.2. Методы описания текстуры.
Статистические моменты.
Автокорреляционная функция.
Описание посредством контуров.
Статистика длин примитивов (СДП).
Спектр Фурье.
Фрактальный подход.
Фильтр Габора.
Вэйвлеты.
Распределение энергии текстуры (РЭТ).
Разность уровней яркости (РУР).
Марковские случайные поля (МСП).
Матрицы совместной встречаемости уровней яркости (МСВУЯ).
2.3. Сравнительный анализ существующих методов описания текстуры
2.4. Первая модификация метода МСВУВ на основе дискретных цепей Маркова.
2.5. Вторая модификация метода МСВУВ на основе дискретных случайных полей Маркова.
2.6. Предобработка изображений для использования метода МСВУВ.
2.7. Пространство признаков классификации.
2.8. Определение параметров признаков.
2.9. Метод поиска шага построения МСВУЯ.
2.10. Выводы.
3. Алгоритм классификации.
3.1. Классификация с минимальным риском.
3.2. Оценка вероятности ошибки классификации.
3.3. Метод классификационного теста.
3.4. Выводы.
4. Оценка результатов.
4.1. Сравнительная характеристика классического и двух предложенных методов формирования МСВУЯ.
4.2. Общие результаты классификации при использовании второй модификации МСВЯУ.
4.3. Анализ признаков, полученных при использовании второй модификации МСВЯУ, шаг 4.
4.4. Формирование кластеров. ц 4.5. Оценка качества кластеров, сформированных при использовании второй модификации МСВЯУ, шаг 4.
На основе расстояния Махаланобиса.
На основе классификации тренировочного множества.
На основе проверки статистической независимости центров кластеров.
4.6. Сравнение экспертной классификации с реализованной автоматической (вторая модификация МСВЯУ, шаг 4).
6.7. Выводы.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Биотехническая система для автоматического определения формулы белой крови2012 год, кандидат технических наук Штадельманн, Жоэль Валентин
Система статистического анализа и нейросетевого распознавания текстурных изображений2007 год, кандидат технических наук Вин Тхей
Методы и средства автоматизированной обработки микроскопических изображений мазков периферической крови для диагностики острых лейкозов2007 год, кандидат технических наук Чистов, Кирилл Сергеевич
Обработка изображений металлических поверхностей в задачах автоматизированного контроля качества изделий2006 год, кандидат технических наук Шевченко, Никита Александрович
Разработка алгоритмов автоматизированной системы распознавания клеток крови2017 год, кандидат наук Панов, Степан Александрович
Введение диссертации (часть автореферата) на тему «Разработка алгоритма распознавания сложных объектов на основе текстурной информации»
Распознавание сложных многопараметрических объектов является далеко нетривиальной задачей не только для систем искусственного интеллекта, но и для эксперта. В качестве яркого примера подобных объектов можно отметить биологические материалы живых организмов. Их изображения могут быть получены при помощи как специальных технологий, например, ультразвукового исследования, рентгеновского излучения, так и посредством видеокамеры, установленной на микроскоп.
Микроскопия является единственной областью лабораторной диагностики, где все еще доминирует трудоемкий субъективный качественный анализ [23]. Большинство медицинских методик ручного микроскопического анализа клеток эксплуатирует замечательные свойства глаз человека мгновенно распознавать соотношения формы, оттенков, текстуры сложных изменчивых объектов. Врач узнает клетки без их измерения, на основе качественных характеристик. Если исследуемых клеток много, а требуемый объем выборки невелик (100 - 200), то такой анализ на «узнавание» при наличии достаточного числа опытных врачей-лаборантов может выполняться в массовом порядке. Значительно хуже справляются глаза человека с дифференциальным подсчетом более серьезных выборок клеток (500) и тем более с большим количеством измерений [24]. Очень трудны и даже вредны для человека анализы с подсчетом флуоресцирующих меток (например, подсчет субпопуляции меченых Б1ТС лимфоцитов). Поэтому доминировавшая до последнего времени ручная микроскопия даже при высокой квалификации врача-лаборанта тяжела, субъективна и ограничена по своим реальным возможностям.
На данный момент широким кругом международных исследователей проведена большая работа по информатизации микроскопии, то есть подключении к микроскопу компьютера и использовании для анализа препарата современные информационные технологии. Компьютерные, или «цифровые» микроскопы отличаются от обычных микроскопов так же, как пишущая машинка от компьютера. В состав ЦМ входят микроскоп (с тринокуляром), средства ввода изображений аналоговая или цифровая камера или цифровой фотоаппарат плюс плата ввода), компьютер и программное обеспечение.
Функции ЦМ сводятся к следующему:
• поле зрения микроскопа отображается на экране монитора компьютера;
• по указаниям врача изображение на экране сохраняется в базе данных компьютера вместе с сопровождающей текстовой информацией;
• информация из базы данных может быть вызвана на экран, передана в другие компьютеры, отредактирована, распечатана;
• при выполнении количественных анализов изображения из базы данных подвергаются компьютерной обработке, целью которой является выделение границ клеток и внутриклеточных структур. Данная процедура называется сегментацией и может проводиться как в автоматическом (для контрастных границ) так и в диалоговом режиме (для слабо контрастных границ).
Первые ЦМ появились более 40 лет назад, однако только в последние 5 лет их применение стало массовым и экономически выгодным. Это связано с бурным прогрессом в области средств съемки изображений, персональных компьютеров, информационных технологий, математических методов обработки изображений. ЦМ стал стандартным недорогим оборудованием современной лаборатории.
Хотя цифровой микроскоп революционно расширил возможности врача-лаборанта, он не принимает самостоятельных решений и оставляет за врачом ответственность за сбор выборки исследуемых клеток и за условия их наблюдения. Применение ЦМ требует такой же высокой квалификации, как и ручная микроскопия. Накопленный за последние 30 лет опыт [22], [30], [55], [78] показал однако, что реализовать на практике потенциальные диагностические возможности ЦМ весьма непросто. Это связано с высокой вариабельностью клеток и клеточных структур, ограниченным разрешением в средствах телевизионного съема изображений, недостаточной контрастностью границ клеточных структур, частичной утратой информации в плоских изображениях по сравнению с трехмерным оригиналом, неравномерностью окраски в процессе приготовления образцов, огромным объемом материала. Разработанные в 70-е годы алгоритмы для анализа крови не смогли обеспечить получение приемлемых устойчивых результатов корректного распознавания клеток. В качестве альтернативы были разработаны проточные счетчики. Основные недостатки этих систем таковы:
• сложная и дорогостоящая процедура подготовки препарата для анализа;
• требование увеличенного количества анализируемого биоматериала;
• отсутствие визуального контроля результатов экспертом;
• невозможность повторного исследования;
• ограниченный набор проводимых тестов;
• высокая стоимость оборудования.
Указанные недостатки помешали массовому распространению подобных систем. В начале 90-х годов коммерчески доступно было только очень небольшое число таких систем на базе микроскопа (например, Leitz Hematrak, Microx Omron Analyzer, Hitachi 8200) [25]. Особо нужно отметить принципиальный недостаток проточных анализаторов - даже самые совершенные из них не могут полностью заменить визуальный анализ мазка крови, который является «золотым стандартом» в гематологии.
В настоящее время на новом витке развития телевизионной и компьютерной техники появляется возможность создания эффективного анализатора мазков крови оптического типа, свободного от перечисленных выше недостатков анализаторов проточного типа и позволяющего осуществлять визуальный контроль и корректировку автоматической классификации.
В данной работе в качестве анализируемых клеток выбраны белые кровяные тельца (лейкоциты) человека. Составление лейкоцитарной формулы (процентного соотношения различных видов лейкоцитов) очень важная и массовая процедура. Изменение лейкоцитарной формулы сопутствуют многим заболеваниям и нередко являются неспецифическими. Тем не менее, диагностическое значение этого исследования велико, оно дает представление о тяжести состояния, эффективности терапии. Например, повышение числа нейтрофилов - нейтрофилез, как правило, сочетается с увеличением общего числа лейкоцитов в крови и наблюдается при острых воспалительных процессах, интоксикациях, шоковых состояниях, при кровотечениях, инфаркте миокарда. Если происходит резкое увеличение общего числа лейкоцитов в крови, то можно диагностировать сепсис, туберкулез, метастазы злокачественных опухолей в костный мозг. Напротив, снижение числа нейтрофилов - нейтропения - обычно наблюдается при вирусных инфекциях, после лучевой терапии.
Подавляющее большинство анализов для составления лейкоцитарной формулы делается вручную при помощи микроскопа и механического счетчика, который равносилен обыкновенным счетам. С помощью малого увеличения (Юх) находят начало мазка крови. Далее при помощи большего увеличения (90х) производят дифференцирование лейкоцитов. Подсчет лейкоцитов проводят, соблюдая следующие правила: начинают, отступив 2-3 поля зрения от края мазка, проходят 3-5 полей зрения вдоль края мазка. Затем 3-5 полей зрения под прямым углом по направлению к середине мазка, снова 3-5 полей зрения параллельно краю, затем под прямым углом и так далее до противоположного края мазка. Затем меняют положение стекла и другую половину клеток считают на противоположном крае. Минимальное количество лейкоцитов, необходимых для проведения анализа - 100. Для более точного результата (например, если при подсчете первой сотни отмечаются какие-либо отклонения) считают еще 100. Существуют и более высокие требования к статистической правдоподобности анализа. При этом необходимо дифференцировать от 500 до 1000 клеток.
Актуальность проблемы создания автоматического классификатора основывается на необходимости проведения в повседневной жизни огромного количества рутинных исследований с привлечением высококвалифицированного медперсонала. Даже частичная компьютеризация с поиском клеток для анализа (с помощью ЦМ) не позволяет кардинальным образом увеличить мощность и эффективность лаборатории, так как в каждом анализе необходимо обработать 100 -1000 клеток. И произвести эту работу по классификации лейкоцитов может только опытный врач-гематолог.
Следует отметить, что лейкоциты - одни из наиболее сложных для классификации биологических объектов ввиду их значительной вариабельности. Помимо разных этапов жизненного цикла самих клеток (они могут быть молодыми, зрелыми, отработанными), на вид лейкоцитов в значительной мере оказывает влияние физическое состояние и здоровье человека. Также сказываются экологические условия, вредные воздействия (например, радиоактивное) и даже время суток, в которое был взят анализ. В настоящее время не получено приемлемых устойчивых результатов корректного распознавания этих клеток оптическим способом. Основной акцент в попытках распознавания лейкоцитов делался на цветовые, метрические и морфологические характеристики клеток. В данной работе в качестве основной дискриминационной характеристики выбрана текстура ядра и цитоплазмы клетки, что позволило получить высокие и стабильные результаты корректного распознавания.
Целью данной работы является разработка алгоритма распознавания сложных биологических объектов на основе текстурной информации на примере белых кровяных телец (лейкоцитов) человека. Эффективность работы алгоритмов, основанных на разрабатываемом методе, должна быть сопоставима с экспертным распознаванием объектов исследования.
Для решения поставленной цели необходимо реализовать следующие задачи:
1) проанализировать объекты предметной области, существующие подходы распознавания лейкоцитов;
2) на основе проведенного анализа оценить информативность параметров описания клеток, сформировать набор наиболее информативных описателей, исключив параметры-артефакты;
3) создать набор инвариантных к группе аффинных преобразований описателей найденных параметров;
4) рассмотреть возможности модификации метода получения классификационных признаков с целью повышения их дискриминационной способности;
5) решить задачу классификации для дифференцирования имеющихся классов с использованием сформированного вектора аффинных инвариантов;
6) оценить полученные результаты, проверить качество кластеризации, обеспечиваемое найденными инвариантными признаками;
Научная новизна работы описывается следующими положениями:
1) введен новый метод распознавания лейкоцитов на основе предложенного набора текстурных дескрипторов, обеспечивающий высокое качество разделения классов объектов, сопоставимое с экспертным распознаванием;
2) разработана модификация метода построения матриц совместной встречаемости уровней яркости (МСВУЯ) на основе дискретных цепей Маркова, позволяющая повысить информативность формируемых текстурных описателей за счет эффективного применения более высоких шагов построения МСВУЯ;
3) разработана модификация метода построения МСВУЯ на основе дискретных
• случайных полей Маркова, позволяющая существенно повысить информативность получаемых текстурных описателей за счет пространственного (двумерного) сбора статистики совместной встречаемости уровней яркости и
Ф формирования единственной матрицы с полной и непротиворечивой информацией о текстуре изображения объекта. Применение модификации обеспечивает высокий дискриминационный потенциал построенных текстурных ф дескрипторов при классификации объектов с ярко выраженными текстурными хар актеристиками;
4) предложен новый метод определения шага построения МСВУЯ на основе интегральных оценок по критерию Фишера, позволяющий значительно упростить и ускорить необходимую процедуру первоначальной настройки системы распознавания;
5) разработан программный комплекс, обеспечивающий среднюю вероятность ф корректной классификации лейкоцитов на уровне 97.2%, что сопоставимо с производительностью высококвалифицированного эксперта.
Положения, выносимые на защиту:
1) предложенный подход к распознаванию, основанный на применении предложенного множества текстурных дескрипторов, обладает высокой (более
• 97%) дискриминационной способностью при классификации лейкоцитов, сопоставимой с экспертным распознаванием;
2) модификация метода формирования МСВУЯ на основе дискретных цепей Маркова позволяет заметно увеличить информативность текстурных дескрипторов, что подтверждено экспериментально;
3) модификация метода формирования МСВУЯ на основе дискретных случайных полей Маркова существенно увеличивает информативность текстурных дескрипторов. Применение модификации позволяет добиться высокого процента корректной классификации лейкоцитов, что подтверждено проведенными экспериментами;
4) предложенный метод определения шага построения МСВУЯ на основе интегральных оценок по критерию Фишера позволяет значительно упростить и ускорить процедуру предварительного обучения системы распознавания.
Практическая ценность работы обуславливается высокими и стабильными показателями работы разработанного программного комплекса. Этот факт дает возможность использовать полученные алгоритмы в составе системы автоматического дифференциального анализа крови, которая является автоматизированным рабочим местом врача-гематолога.
Научные результаты, изложенные в диссертации, реализованы автором в виде программного комплекса для автоматического распознавания динамических объектов с ярко выраженной текстурной характеристикой.
Основные научные результаты диссертации были использованы при проведении в ООО «ОЭС» (г. Санкт-Петербург) фундаментально-поисковой НИР «Исследование эффективности применения текстурных дескрипторов при классификации объектов урбанистической сцены». Алгоритмические разработки и научно-практические рекомендации были применены научно-коммерческой фирмой «Диамант» (г. Санкт-Петербург) при реализации проекта «Анализатор качества характеристик объектива промышленного сканера», внутреннее техническое задание №0371ТЗ.
В процессе работы над диссертацией были осуществлены публикации [16-21], отражающие поэтапное появление основных результатов исследования.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Разработка и исследование методов выделения дешифровочных признаков для классификации текстурных аэрофотоизображений1999 год, кандидат технических наук Белов, Тимур Владимирович
Методы и алгоритмы обработки растровых изображений для решения задач автоматизированной микроскопии медико-биологических препаратов2007 год, кандидат технических наук Привалов, Олег Олегович
Разработка системы технического зрения для автоматизации цитоморфологических анализов крови2001 год, кандидат технических наук Новиков, Константин Владимирович
Методы и программные средства автоматизации анализа изображений медико-биологических микрообъектов2005 год, кандидат технических наук Степанов, Василий Николаевич
Автоматизированная классификация спутниковых РСА-изображений для целей мониторинга ледового покрова арктических морей2000 год, кандидат географических наук Богданов, Андрей Владимирович
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Яковенко, Максим Константинович
6.7. Выводы
С помощью разработанного в рамках данной работы программного комплекса было проведено всестороннее практическое изучение предлагаемых здесь теоретических выкладок. Сравнение результатов классификации с использованием классического метода формирования МСВУЯ и описанных в данной работе двух модификаций позволяет сделать вывод о достигнутом улучшении производительности. Метод модификации МСВУЯ на основе дискретной модели МСП (вторая предложенная модификация) показал наивысшие результаты корректной классификации, значительно превышающие показатели, соответствующие классическому методу. Первый предложенный метод модификации МСВУЯ на основе дискретных цепей Маркова показал несколько худшие результаты, чем вторая модификация, но в целом лучше, чем классический подход. Надо отметить зафиксированную высокую стабильность результатов первой модификации в широком диапазоне изменения шага построения МСВУЯ. Это свойство в сочетании с достаточно высокими результатами корректной классификации делает этот предложенный метод довольно привлекательным.
Так как вторая предложенная модификация МСВУЯ на основе дискретной модели МСП показала наивысшую производительность, далее подробно исследовалась эта конфигурация.
Исследования зависимости корректной классификации клеток от шага показали высокую стабильность распознавания лимфоцита - 100% для всех шагов. Самая нестабильная клетка - эозинофил. Это можно объяснить высокой компактностью клетки лимфоцита с преобладанием ядра над цитоплазмой. По всей видимости, именно ядро клетки обладает наиболее постоянным и характерным текстурным рисунком, обусловленным укладкой нитей хроматина в соответствие с предназначением клетки в работе иммунной системы. Цитоплазма, напротив, обладает высокой вариабельностью состава разного рода включений и пустот, что обусловлено обеспечением процессов жизнедеятельности клетки и проходящих в ней обменных процессов. В связи с этими предположениями можно сделать вывод о более высокой информативности текстуры ядра по сравнению с текстурой цитоплазмы. В качестве дальнейшего исследования может быть осуществлена проверка данной гипотезы. Вполне вероятна ситуация внесения цитоплазмой ложных коррекций в общую статистику текстуры клетки. Подтверждение данной гипотезы не потребует переработки рассмотренных в данной работе теоретических и практических решений. Потребуется только еще одно процедура предобработки входного изобращения, которая будет отделять ядро клетки от цитоплазмы.
Была проведена оценка качества сформированных кластеров для доказательства не случайности и устойчивости полученных результатов классификации. Для этих целей здесь было предложено задействовать три различных теста: на основе расстояния Махаланобиса между сформированными кластерами, на основе тестирования классификатора с помощью тренировочной базы и на основе статистической независимости центров кластеров. Все тесты показали отличные результаты, что указывает на высокое качество кластеризации на основе предложенного в данной работе набора признаков. Качество достигнутой кластеризации позволяет сделать вывод о потенциально высокой стабильности системы распознавания при изменении внешних (параметры получения изображения, вариабельность в прокраске образцов) и внутренних (жизнедеятельность клетки, общее состояние организма) условий.
Сбалансированный по классам средний результат корректного распознавания лейкоцитов составил 97.2%. Приведенный к процентному соотношению реальной совместной встречаемости клеток в анализируемом образце результат корректного распознавания лейкоцитов составил 98.4%. Это самый большой из известных автору на данный момент результат автоматической классификации. Он вполне сравним со средним результатом работы профессионального эксперта -98.03%. Следует отметить, что полученный здесь результат был достигнут на достаточно сложной для подобного эксперимента базе изображений клеток, так как материал был собран из нескольких госпиталей за продолжительное время и от множества пациентов [86]. То есть отсутствует субъективный фактор в получении образцов. При этом в тренировочной базе классификатора a priori присутствуют реальные объекты, а не сформированные специально для конкретной научной работы, как это встречается у подавляющего большинства авторов. С одной стороны, этот факт позволяет утверждать о способности системы работать в реальных, а не исследовательских условиях. С другой стороны, учитывая публичную доступность используемой базы клеток, каждый может повторить эксперимент, описанный в данной работе. Ни один автор ранее не предоставлял такой возможности в описываемой предметной области.
Заключение
В диссертационной работе был осуществлен анализ имеющихся на данный момент подходов к решению задачи дифференцирования лейкоцитов. В качестве основной отправной точки для автоматического классификатора послужил медицинский алгоритм распознавания клеток, использующийся в реальной практике врачей-гематологов. Были рассмотрены основные предпринятые к настоящему времени попытки реализации автоматического классификатора лейкоцитов, выявлены основные результаты работы таких систем, их отличительные и характерные особенности, принципиальные недостатки и причины, помешавшие их развитию и практическому применению. Также был проведен патентный поиск на предмет выявления новых идей для аппаратного и/или программного решения данной проблемы. В результате были обнаружены только различные варианты аппаратуры и методологий для обработки (различными видами реагентов) и считывания помеченных клеток проточным анализатором. Таким образом, патентный поиск не внес корректив в составленную итоговую классификацию, объединяющую и систематизирующую все существующие на данный момент (в том числе и предлагаемый здесь) способы автоматической классификации белых кровяных телец человека.
В результате проведенных исследований объектов данной предметной области и экспертного алгоритма дифференцирования клеток был предложен новый метод автоматического распознавания лейкоцитов, основанный на применении текстурных дескрипторов. С его помощью может быть построена высокоэффективная система автоматического распознавания клеток крови. В то же время, указанный подход может быть применен и к другим объектам исследования. В качестве таких объектов могут быть взяты любые образцы, в распознавании которых решающую роль играет текстурные рисунки. Примером могут служить ультразвуковые изображения печени, микроизображения образцов различных биологической ткани при исследованиях злокачественных опухолей, а также все ядерные клетки флоры и фауны. Высоким потенциалом обладает предложенный подход и в ряде технических приложений.
Таким образом, предлагаемый подход обладает высоким потенциалом для автоматической классификации лейкоцитов. Он лишен недостатка методов, опирающихся на внешние признаки объектов (цветовые, метрические характеристики), выделяя внутренние закономерности и упорядоченную структуру. В этом он схож принципам распознавания, используемым мозгом человека. Вместе с тем, он обладает достаточной долей универсальности в плане объектов исследования. Следовательно, он может быть с высокой вероятностью применен для построения ряда других искусственных интеллектуальных систем.
Для распознавания объектов данной предметной области должны быть сформированы признаки, инвариантные к вращению, сдвигу и масштабным преобразованиям. В процессе работы было проведено исследование существующих способов построения текстурных описателей. В результате осуществленного литературного анализа были выяснены высокие дискриминационные возможности дескрипторов текстуры, полученных с использованием МСВУЯ. Еще одним немаловажным критерием выбора указанного метода является наличие необходимых свойств инвариантности у получаемых таким образом дескрипторов.
В данной работе были предложены новые две модификации метода построения МСВУЯ в целях повышения информативности и дискриминационной способности получаемых на его основе текстурных дескрипторов. Для этого были использованы нотация дискретных полей Маркова и модель МСП. При применении модификации на основе дискретных цепей Маркова одна условная вероятность характеризует переход из одного пикселя в группу пикселей изображения. Взаимодействия последовательностей пикселей одной яркости обладают большей характеризующей способностью, нежели чем взаимодействия отдельных уровней. На информации о наличие определенных последовательностей основан метод описания текстуры с помощью статистики длин примитивов. Таким образом, при использовании статистики совместной встречаемости отдельных уровней яркости и последовательностей уровней яркости может быть повышена характеризующая способность формируемых МСВУЯ. Разработанная модификация метода построения МСВУЯ на основе дискретных случайных полей Маркова позволяет существенно повысить информативность получаемых текстурных описателей за счет пространственного (двумерного) сбора статистики совместной встречаемости уровней яркости и формирования единственной матрицы с полной и непротиворечивой информацией о текстуре изображения объекта. Применение модификации обеспечивает высокий дискриминационный потенциал построенных текстурных дескрипторов при классификации объектов с ярко выраженными текстурными характеристиками.
Для уменьшения вычислительной нагрузки при использовании МСВУЯ необходимо провести предобработку исходных изображений с целью понижения количества уровней яркости. Для этого предлагается задействовать описанный алгоритм равновероятностной квантизации.
Был сформирован 25-мерный вектор признаков, используемых для классификации лейкоцитов. Подавляющее большинство этого набора (24 единицы) составляют текстурные дескрипторы. Они являются инвариантами к вращению, сдвигу и масштабным преобразованиям.
Все признаки были построены трижды для проведения сравнительного анализа классического метода построения МСВУЯ и двух предложенных в данной работе методов.
Были проведены исследования для выяснения вида функции распределения значений признаков классификации клеток. В связи с тем, что указанные распределения оказались в большинстве своем близки к нормальному распределению, то было принято решение об использовании статистического классификатора на основе правила Байеса. В этом случае в качестве дискриминационной характеристики используется расстояние Махаланобиса, определяющие расстояние между кластерами в и-мерном пространстве признаков.
Применение статистического классификатора позволяет оценить вероятность ошибки классификации, вызванной пересечением кластеров в пространстве. Эта вероятность связана с расстоянием Махаланобиса между кластерами. Построенная зависимость вероятности ошибки и расстояния Махаланобиса используется в данной работе при оценке результатов для определения достигнутого качества дифференцированности кластеров.
При имеющимся размере базы данных объектов исследования невозможно провести адекватное классическое тестирование (с разбиением всей базы данных на две группы: тренировочную и тестовую) дискриминационных способностей сформированного множества признаков. Поэтому было принято решение воспользоваться методом 1еауе-опе-ои(, который также обеспечивает соблюдение необходимой независимости параметров сформированного классификатора от тестируемого в данный момент времени образца.
С помощью разработанного в рамках данной работы программного комплекса было проведено всестороннее практическое изучение теоретических результатов. Сравнение результатов классификации с использованием классического метода формирования МСВУЯ и описанных в данной работе двух модификаций позволяет сделать вывод о достигнутом улучшении производительности. Метод модификации МСВУЯ на основе дискретной модели МСП (вторая предложенная модификация) показал наивысшие результаты корректной классификации, значительно превышающие показатели, соответствующие классическому методу. Первый предложенный метод модификации МСВУЯ на основе дискретных цепей Маркова показал несколько худшие результаты, чем вторая модификация, но в целом лучше, чем классический подход. Надо отметить зафиксированную высокую стабильность результатов первой модификации в широком диапазоне изменения шага построения МСВУЯ. Это свойство в сочетании с достаточно высокими результатами корректной классификации делает этот предложенный метод довольно привлекательным.
Была проведена оценка качества сформированных кластеров для доказательства не случайности и устойчивости полученных результатов классификации. Для этих целей в данной работе было предложено задействовать три различных теста: на основе расстояния Махаланобиса между сформированными кластерами, на основе тестирования классификатора с помощью тренировочной базы и на основе статистической независимости центров кластеров. Все тесты показали высокие результаты, что указывает на высокое качество кластеризации на основе предложенного в данной работе набора признаков.
Сбалансированный по классам средний результат корректного распознавания лейкоцитов составил 97.2%. Приведенный к процентному соотношению реальной совместной встречаемости клеток в анализируемом образце результат корректного распознавания лейкоцитов составил 98.4%. Это самый большой из известных автору на данный момент результат автоматической классификации. Он вполне сравним со средним результатом работы профессионального эксперта -98.03%.
На основании достигнутых высоких результатов проверки и независимого тестирования может быть принято решение о целесообразности использования разработанного метода и программного комплекса для решения задачи автоматической классификации лейкоцитов человека.
Таким образом, в процессе работы были успешно решены все поставленные в начале задачи. Дополнительно в данной работе был предложен оригинальный метод, который позволяет проводить автоматическое определение шага формирования текстурных признаков на основе МСВУЯ с низкими вычислительными затратами. Это особенно актуально в условиях полученной размерности пространства признаков при достаточно большой тренировочной выборке.
Цель данной исследовательской работы считается достигнутой.
Список литературы диссертационного исследования кандидат технических наук Яковенко, Максим Константинович, 2003 год
1. Абрамов М.Г. Гематологический атлас. М.: Медицина, 1979.
2. Астафьева Н. М. Вейвлет-анализ: основы теории и примеры применения.// Успехи физических наук, 1996 Т. 166, № 11. с. 1145 1170.
3. Дуда Р., Харт П. Распознавание образов и анализ сцен. Пер. с англ. М.: Мир, 1976.
4. Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. М.: МЦНМО, 2000.
5. Крамер Г., Математические методы статистики. Пер. с англ. М.: Мир, 1975.
6. Методы передачи изображений. Сокращение избыточности / Прэтт У.К., Сакрисон Д.Д., Мусманн Х.Д. и др. Пер. с англ. М.: Радио и связь, 1983.
7. Наймарк М.А. Теория представлений групп. М: Наука, 1976.
8. Павлидис Т., Алгоритмы машинной графики и обработки изображений. Пер. с англ. М.: Радио и связь, 1986.
9. Прэтт У. Цифровая обработка изображений. Пер. с англ. М.: Мир, Т.1, 2., 1981.
10. Тихонов М. И., Миронов М. А. Марковские процессы. М.: Сов. радио, 1977.
11. Ту Дж., Гонсалес Р., Принципы распознавания образов. Пер. с англ. М.: Мир, 1978.
12. Федер Е. Фракталы. Пер. с англ. М.: Мир, 1991.
13. Фурман Я. А. Основы теории обработки контуров изображений. Йошкар-Ола: МарГТУ, 1997.
14. Шведов A.M., Шмидт A.A., Якубович В.А. Инвариантные системы признаков в распознавании образов// Автоматика и телемеханика, №3, 1979.
15. Яковенко М.К., Построение набора инвариантных признаков для классификации изображений биологических клеток// В сборнике докладов 5-й научной сессии аспирантов ГУАП 8-12 апреля 2002. с. 452 455.
16. Яковенко М.К., Инвариантные признаки в задаче распознавания образов// В сборнике докладов 4-й научной сессии аспирантов ГУАП 26-30 марта 2002. с. 326 -327.
17. Яковенко М.К., Статистические описатели текстуры// В сборнике докладов 5-й международной научно-технической конференции «Цифровая обработка сигналов и ее применение», 14-16 марта 2003.
18. Яковенко М.К., Распознавание объектов с динамическими характеристиками// Информационно-управляющие системы, №2-3, 2003. с. 8 15.
19. Яковенко М.К., Компьютерная обработка и анализ изображений// BYTE Россия, №6, 2000. с. 54 59.
20. Abbott Diagnostics: www.abbott.com/products/diagnostics.htm
21. Augustejin M.F., Performance evaluation of texture measures for ground cover identification in satellite images by means of neural-network classifier// IEEE Transactions on Geoscience and Remote Sensing, vol.33, 1995. pp 615 625.
22. Aus H.M., Harms H., Meulen V., Gunzer U., Statistical Evaluation of Computer Extracted Blood Cell Features for Screening Populations to Detect Leukemias// Pattern Recognition Theory and Applications. Berlin: Springer-Verlag, 1987.
23. Bacus J.W., Gose E.E., Leukocyte pattern recognition// IEEE Transactions on Systems, Man, and Cybernetics, vol. SMC-2, №4, 1972. pp. 513 526.
24. Bacus J.W; Rush-Presbyterian-St. Luke's Medical Center, Chicago, Illinois, US patent. 4199748: Automated method and apparatus for classification of cells with application to the diagnosis of anemia. 1980, МКИ G 06 К 9/00; НКИ 340/146.3.
25. Baf J.M.H., Kardan M., Spann N., Texture feature performance for image segmentation// Pattern Recognition, vol.23, №3/4, 1990. pp. 291 309.
26. Bayer Diagnostics: www.bayer.com
27. Becman Coulter: www.coulter.com/coulter/hematolory/
28. Besag J., Spatial interaction and the statistical analysis of lattice systems (with discussions)// Journal of the Royal Statistical Society, №36, 1974. pp. 192 236.
29. Brodatz P., Textures: a photographic album for artists and designers, New York: Dover publications, 1966. Brodatz database: www.ux.his.no/~tranden/br odatz/
30. Chaudhuri B.B., Sarkar N., Kundu P., Improved Fractal Geometry Based Texture Segmentation Technique// IEE Proceedings №140, 1993. pp. 233 241.
31. Chellappa R., Chatterjee S., Classification of textures using Gaussian Markov random fields// IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. ASSP-33, №4, 1985. pp. 959- 963.
32. Chen C.C., Chen P.C., Filtering methods for texture discrimination// Pattern Recognition Letters, vol.20, 1999. pp. 783 790.
33. Cheng G.C., Patent US3919530: Color Information leukocytes analysis system// www, delphion. com/details ?pn 10=US 03 919530, 1994.
34. Comaniciu D., Meer P., Foran D.J., Image-guided decision support system for pathology// Machine Vision and Applications, №11, 1999. pp. 213 224.
35. Conners R.W., Harlow C.A., A Theoretical Comaprison of Texture Algorithms// IEEE Transactions on Pattern Analysis and Machine Intelligence, №2, 1980. pp. 204 222.
36. Conners R.W., Trivedi M.M., Harlow C.A., Segmentation of a High-Resolution Urban Scene using Texture Operators// Computer Vision, Graphics and Image Processing, №25, 1984. pp. 273 -310.
37. Daugman J., Uncertanity relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters// Journal of the Optical Society, vol.2, №7, 1985. pp. 1160 1169.
38. Davis L.S., Mitiche A., Edge detection in textures// Computer Graphics and Image Processing, №12, 1980. pp. 25 39.
39. Fogel I., Sagi D., Gabor Filters as Texture Discriminator// The Journal of Biological Cybernetics, №61, 1989. pp. 103 113.
40. Galloway M.M., Texture classifications using gray level run lengths// Computer Graphics and Image Processing, №4, 1975. pp. 172 179.
41. Haialick R.M., Shanmugam K, Dinstein I., Textural features for image classification// IEEE Transactions on Systems, Man and Cybernetics, vol. SMC-3, №6, 1973. pp. 610 -621.
42. Hashizume A., Suzuki R., Yokouchi H., Horiuchi H., Yamamoto S., Patent US4175859: Apparatus for automated classification of white blood cells// www.delphion.com/details?pnl0=US04175859, 1999.
43. James M., Classification Algorithms. New York: Wiley & Songs, 1985.
44. Kaneko H., Yodogawa E., A Markov random field application to texture classification// in Proceedings of Conference Pattern Recognition and Image Processing, IEEE Computer Society, Las Vegas, NE, 1982.
45. Katz A.R.J., Image Analysis and Supervised Learning in the Automated Differentiations of White Blood Cells from Microscopic Images. Royal Melbourne Institute of Technology, 2000. www.cs.rmit.edu.au/~vc/papers/katz-mbc.pdf
46. Laws K.I., Rapid texture identification// SPIE Image processing for missile guidance. 1980. pp. 376-380.
47. Li S.Z., Markov Random Field Modeling in Computer Vision. New York: SpringerVerlag, 1999.
48. Linder J., Automation in cytopathology// The American Journal of Clinical Pathology, vol. 98, №4, 1992. pp. S47 S51.
49. McGoogan E, Reith A, Would monolayers provide more representative samples and improved preparations for cervical screening?// Acta Cytologica, vol. 40, №1, 1996. p. 107.
50. Meastex database: www.cssip.elec.uq.edu.au/~guy/meastex/meastex.html
51. Mojsilivic A., Popovic M., Markovic S., Krstic M., Characterization of Visually Similar Diffuse Diseases from B-Scan Liver Images Using Nonseparable Wavelet Transform// IEEE Transactions on Medical Imaging, vol. 17, №4, 1998. pp. 541 549.
52. Ojala T., Pietikainen M., A comparative study of texture measures with classification based on feature distribution// Pattern Recognition vol.29, №1, 1996. pp. 51 59.
53. Ohanian P.P., Dubes R.C., Performance evaluation for four classes of textural features// Pattern Recognition, vol.25, №8, 1992. pp. 819 833.
54. Ohno S., Patent US5288403: Filter for removing leukocytes// http://www.delphion.com/details?pn=US05288403 . 1992.
55. Parker J.R., Algorithms for image processing and computer vision. New York.: Wiley computer publishing, 1999.
56. Parzen E., Modern Probability Theory and Its Applications. John Wiley, New York,1969, pp. 136- 147.
57. Pentland A.P. Fractal-based Description of Natural Scenes// IEEE Transactions on Pattern Analysis and Machine Intelligence, №6, 1984. pp. 661 672.
58. Press W.H., Teukolsky S.A., Vetterling W.T., Flannery B.P. Numerical recipes in C: The art of scientific computing 2nd edition. Cambridge university press, 1992.
59. Pressman N.J., Markovian analysis of cervical cell images// The Journal of Histochemistry and Cytochemistry, vol. 24, №1, 1976. pp. 138 144.
60. Randen T., Husoy J.H., Filtering for texture classification: a comparative study// IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.21, №4, 1999. pp. 291 -310.
61. Rosenfeld A., Troy E.B., Visual texture analysis// IEEE Conference Record of the Symposium on Feature Extraction and Selection in Pattern Recognition. IEEE, NY,1970. pp 155 124.
62. Russ J.C., Surface Characterization: Fractal Dimensions, Hurst Coefficients, and Frequency Transforms// Journal of Computer Assisted Microscopy, vol. 2, 1990. pp. 249 -257.
63. Sakata T., Morikawa T., Uchihashi K., Hashimoto T., Patent US5618733: Reagent for analysis leucocytes// www. delphion.com/details?pn=US05618733 , 1997.
64. Sarkar N., Chaudhuri B.B., An Efficient Differential Box Counting Approach to Compute Fractal Dimension of Image// IEEE Transactions on Systems, Man, and Cybernetics, vol. 24, 1994. pp. 115 120.
65. Schistad A.H., Jain A.K., Texture Fusion and Feature Selection Applied to SAR Imagery// IEEE Transactions on Geoscience and Remote Sensing, vol. 35, №2, 1997. pp. 475 479.
66. Sharma M., Markou M., Singh S., Evaluation of texture methods for image analysis// www.eng.iastate.edu/ee528/Papers/texturecomparison.pdf
67. Smith G., Ohanian and Dubes Comparisons// www.cssip.uq.edu.au/staff/meastex/www/comparisons/ohanianDubesCmp.html
68. Smith G., Variations of GLCM varying distance parameter// www.cssip.uq.edu.au/staff/meastex/www/comparisons/glcmDistance.html
69. Song X., Abu-Mostafa Y., Sill J., Kasdan H., Incorporating Contextual Information in White Blood Cells Identification// Advances in Neural Information Processing Systems, MIT Press, 1997. www.ece.ogi.edu/~xubosong/irisNIPS.ps
70. Suzuki R. et al., US patent 4129854: Cell classification method. 1978, MKM G 06 K 9/00, G 01 N 33/16; HKH 340/146.3.
71. Sysmex corporation: www.dokkyomed.ac.jp/dep-k/cli-path/www-S YSMEX.html
72. Vistex database: www-white.media.mit.edu/vismod/imagery/VisionTexture/vistex.html
73. Wavelet and Their Application (Ed. R Coifman) Boston: Jones and Barlett Publ., 1992.
74. Weszka J.S., Dyer C.R.,Rosenfeld A., A Comparative Study of Texture measures for Terrain Classification// IEEE Transactions on Systems Man and Cybernetics, №6, 1976. pp. 269 285.
75. Woods J.W., Two-dimensional discrete Markovian fields// IEEE Transactions on Information Theory, vol. IT-18, №2, 1972. pp. 232-240.
76. Young I.T. The Classification of White Blood Cells// IEEE Transactions on Biomedical Engineering, vol. BME-19, №4, 1972. pp. 291 298.
77. Zucker S.W., Terzopoulos D., Finding Structure in Co-occurrence Matrices for
78. Texture Analysis// Computer Graphics and Image Processing, vol. 12, 1980. pp. 286 308.86. www.cellatlas.com87. www.delphion.com
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.