Математические методы моделирования и классификации объектов на основе технического зрения и машинного обучения тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Нгуен Тху Хыонг

  • Нгуен Тху Хыонг
  • кандидат науккандидат наук
  • 2019, ФГБОУ ВО «Байкальский государственный университет»
  • Специальность ВАК РФ05.13.18
  • Количество страниц 133
Нгуен Тху Хыонг. Математические методы моделирования и классификации объектов на основе технического зрения и машинного обучения: дис. кандидат наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. ФГБОУ ВО «Байкальский государственный университет». 2019. 133 с.

Оглавление диссертации кандидат наук Нгуен Тху Хыонг

Введение

1 ТЗ и МО для обнаружения и классификации дефектов дорожного покрытия и пузырьков

1.1 Машинное обучение: задачи и приложения

1.2 Обнаружение и классификация дефектов дорожного покрытия: задачи и методы

1.2.1 Описание дефектов дорожного покрытия

1.2.2 Методы извлечения признаков дефектов дорожного покрытия

1.2.3 Методы МО в обнаружении и классификации дефектов дорожного покрытия

1.2.4 Программные комплексы обнаружения и классификации дефектов дорожного покрытия

1.2.5 Комбинация метода Марковского случайного поля с методом разреза на графах для сегментации изображений

1.3 Алгоритм случайного леса в задаче классификации данных

1.4 Приложение ТЗ в задаче обнаружения пузырьков

1.4.1 Методы обнаружения пузырьков

1.4.2 Обзор программ обнаружения пузырьков

1.4.3 Использование вейвлет-преобразования при обнаружении дефектов

1.5 Основные результаты и выводы по главе

2 Математические модели и численные методы решения задач классификации объектов на основе методов ТЗ и МО

2.1 Предварительная обработка и извлечение признаков в системах ОКДДП и ОП

2.1.1 Предварительная обработка изображений в системах ОКДДП и ОП

2.1.2 Извлечение признаков в системах ОКДДП и ОП

2.2 Математическое моделирование и численные методы сегментации в системах ОКДДП и ОП

2.2.1 Численный метод построения карты дефектов дорожного покрытия

2.2.2 Численный метод обнаружения пузырьков

2.3 Математическое моделирование и численные методы классификации дефектов

2.3.1 Проблема несбалансированных данных

2.3.2 Классификация дефектов в системе ОКДДП

2.4 Применение методов и алгоритмов ТЗ и МО для обнаружения и классификации объектов на изображениях

2.4.1 Применение методов и алгоритмов ТЗ и МО для обнаружения и классификации дефектов дорожного покрытия

2.4.2 Применение методов и алгоритмов ТЗ для обнаружения пузырьков

2.5 Основные результаты и выводы по главе

3 Реализация методов ТЗ и МО для классификации дефектов в системах ОКДДП и ОП

3.1 Структура программы обнаружения и классификация дефектов в системах ОКДДП и ОП

3.1.1 Модуль ввода/вывода данных

3.1.2 Модуль предварительной обработки изображения

3.1.3 Модуль сегментации изображения

3.1.4 Модуль извлечения признаков

3.1.5 Модуль классификации дефектов

3.2 Постановка экспериментов

3.2.1 Верификация системы обнаружения и классификации дефектов дорожного покрытия

3.2.2 Верификация системы обнаружения пузырьков на изображениях

3.2 Программное обеспечение для обнаружения и классификации дефектов на изображениях

3.3.1 ПО обнаружения и классификации дефектов дорожного покрытия

3.3.2 ПО обнаружения пузырьков

3.4 Основные результаты и выводы по главе

Приложения

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Математические методы моделирования и классификации объектов на основе технического зрения и машинного обучения»

Введение

Актуальность исследования. Быстрое развитие информационных технологий (ИТ) сделало возможным сбор и хранение многомерных данных для создания эффективных информационных систем. Для преобразования данных в полезные знания требуется развитие новых алгоритмов и программных средств. Таким образом, алгоритмы машинного обучения (МО) стали областью популярных исследований и приложений. МО [176, 172] - важнейшая область искусственного интеллекта, которая имеет множество реальных приложений в различных областях. Например, поисковые инструменты Google [84], Яндекс [178] анализируют семантику ключевых слов поиска и, используя методы МО, выдают лучшие результаты поиска или лучшие предложения, товары и услуги для конкретного пользователя. Методы МО начинают широко использоваться при проектировании и обслуживании различных энергосистем. Другие приложения МО включают социальные сети VK [171] и Facebook [72], анализирующие интересы и персональные данные клиентов для увеличения продаж. В анализе медицинских изображений для автоматического выявления или прогнозирования вероятности развития патологии пациента активно используется не только МО, но и компьютерное зрение [39, 57]. С помощью МО решаются задачи автоматического распознавания голоса в системах безопасности [49, 61] автоматической классификации (изображений, видео, текста), обнаружение вирусов или мошенничества в банковских информационных системах и др. [127, 162]. Методы компьютерного зрения и машинного обучения использовались в задаче автоматизации антропометрии [13, 14, 15, 16, 137, 138]. В основе МО лежит процесс обучения на специально размеченных данных либо такая разметка происходит автоматически. Это позволяет решить конкретную задачу, построить автоматизированные системы и даже оказывать экспертную помощь в различных областях естествознания. По сути методы МО автоматизируют построение

аналитических моделей, основываясь на данных. В методах МО используются итеративные алгоритмы для изучения данных и поиска в них ценной информации для получения новых знаний. МО не является чем-то абстрактным, а скорее конкретным вычислительным инструментом, который уже сейчас играет важную роль в услугах, которые люди используют каждый день. Используя преимущества методов и алгоритмов МО и технического зрения (ТЗ), в диссертации рассмотрены две задачи. Первая задача состояла в автоматизации обнаружения и классификации дефектов дорожного покрытия на изображениях. Вторая задача состояла в автоматизации средств изучения динамики фазовых переходов путем обнаружения и классификации пузырьков в жидкости.

Автоматизация в автотранспортной отрасли и привлекает большое внимание исследователей [27]. Среди важных факторов влияния на эффективность автодорожного хозяйства отметим дефекты поверхности дороги.

Действительно, поддержка инфраструктуры для надежного и энергоэффективного функционирования автотранспорта является важной задачей. Для содержания и планирования ремонта дорог, дорожные компании нуждаются в точной и своевременной информации о дефектах дорог. В мире миллионы дорог, которые необходимо проверять каждый год. Ранее периодические проверки проводились вручную инженерами. Этот метод требует много времени. За последние несколько лет был проведено ряд успешных исследований в области автоматического обнаружения и классификации дефектов дорожного покрытия методами МО и технического зрения (ТЗ) [141, 180]. При этом решалась задача оптимизации и планирования проведения дорожных ремонтных работ с использованием алгоритмов построения оптимальных покрытий [9, 10, 12].

Содержание работы [116] заключается в том, чтобы изучить степень влияния автодорог на энергоэффективность электромобилей. Были построены и проанализированы 8 регрессионных моделей. В статье [46] проанализирован уровень энергоэффективности автотранспорта и ВВП в развитых странах, чтобы выяснить характеристики развития энергопотребления в автотранспортной

отрасли. Работа выполнена с использованием метода «усреднения байесовских моделей» для определения основных факторов. В статье [120] анализируется уровень потребления энергии и выбросов транспортных средств на разных типовых маршрутах и автодорогах. В статье предлагается оптимизация автотранспортной сети на основе оценки потребления энергии на дорогах. В работе [181] представлена оценка уровня потребления энергии и выбросов СО2 в условиях содержания бетонных покрытий автодорог. На основании проведенного анализа литературы, отметим, что мониторинг и поддержка автотранспортной инфраструктуры, распознавание и классификация дефектов дорожного покрытия, является важнейшей задачей, оказывающей критическое влияние на энергоэффективность и устойчивое развитие мировой экономики.

Имеются программы, которые автоматически обнаруживают и классифицируют дефекты дорожного покрытия, такие, как RoadCrack vehicle [58], система дорожной разметки ARAN [155], мобильная система для оценки дорожного покрытия [115]. Но в этих исследованиях основное внимание уделяется только дефектам типа «трещина», не было проведено исследований, в которых обнаруживали различные типы дефектов, как для отдельных изображений, так и для видеопоследовательностей.

Вторая задача, рассмотренная нами, заключается в обнаружении пузырьков в жидкости. Задача обнаружения пузырьков возникает в таких важных областях, как изучение фазовых переходов [110], медицинские технологии [150], контроль процессов на фармацевтическом производстве [74], нефтяная промышленность . Применение методов технического зрения позволяет разрабатывать эффективные [67] алгоритмы обнаружения пузырьков. В двухфазных средах входные изображения весьма разнообразны и часто имеют сложный фон. Пузырьки часто касаются, располагаются друг за другом. Поэтому обнаружение и вычисление характеристик непростая задача.

Таким образом, выбор и применение алгоритмов ТЗ в комбинации с методами МО для решения вышеуказанных задач очень важны. Сформулируем эти задачи более конкретно.

Задача 1. Обнаружение и классификация дефектов дорожного покрытия (ОКДДП). На основе изображений дорожного покрытия необходимо распознать и классифицировать различные дефекты. В работе рассмотрены три основных классов дефектов: глубокие трещины, сеть трещин и выбоины.

Задача 2. Обнаружение пузырьков на изображениях (ОП). На изображении требуется определить в заданной области количество пузырьков, их диаметр, а также распределение их размера. Задача относится к автоматизации средств изучения динамики фазовых переходов.

Цель и задачи исследования. Работа посвящена разработке математических методов расчета моделей технического зрения и машинного обучения для распознавания и классификации дефектов дорожного покрытия и пузырьков для исследования фазовых переходов «жидкость-газ».

Для достижения целей работы необходимо выполнить основные задачи диссертации, а именно:

1) выбрать и усовершенствовать методы обнаружения объектов в соответствии с различными условиями их регистрации;

2) разработать методы и алгоритмы МО для классификации изображений;

3) разработать алгоритмы обработки изображений для извлечения признаков объектов на изображениях при наличии шума;

4) разработать и реализовать программный комплекс на основе методов обработки, анализа изображений, таких, как: предобработка, сегментация, анализ и извлечение признаков, формирование базы данных изображений и анализ эффективности созданных программных библиотек;

5) оценить качество и эффективность работы программного комплекса на тестовых изображениях. Предложить средства для повышения эффективности работы.

Методы исследования. Методы теоретических исследований: методы распознавания образов, и обработки изображений, интегральные преобразования. Методы прикладных исследований: проектирование алгоритмов для решения задачи извлечения и классификации признаков дефектов дорожного покрытия и пузырьков, тестирование программ, оценка эффективности и сравнение результатов.

Научная новизна результатов диссертационной работы заключается в следующем:

1) разработаны новые математические методы моделирования для решения задач обнаружения, анализа признаков и классификации объектов (дефектов дорожного покрытия и пузырьков) на основе технологий ТЗ и методов МО;

2) разработаны комплексированные алгоритмы извлечения признаков дефектов дорожного покрытия и пузырьков с учетом особенностей регистрации анализируемых изображений;

3) эффективные численные методы и алгоритмы машинного обучения реализованы в виде комплексов проблемно-ориентированных программ на основе комбинации марковских случайных полей и метода разреза на графах для улучшения качественных характеристик сегментации изображений; алгоритм случайного леса применен для классификации дефектов дорожного покрытия;

4) разработан метод распознавания пузырьков в фазовом переходе «жидкость-газ» с использованием вейвлет-преобразования Хаара;

Теоретическая значимость. Разработаны алгоритмы улучшения изображений, комплексные алгоритмы извлечения признаков, реализованы эффективные численные методы, проведены комплексные исследования научных и технических проблем, связанных с мониторингом и эксплуатацией автодорожного хозяйства и для поддержки исследований фазовых переходов «жидкость-газ».

Научная ценность исследования заключается в совершенствовании методов обнаружения и классификации дефектов на изображениях. Исследование

способствует развитию и внедрению методов МО и ТЗ в автоматизированных системах неразрушающего контроля качества. Проведен эффективный синтез методов извлечения признаков дефектов дорожного покрытия и создан инструментарий для исследования фазовых переходов в жидкости путем мониторинга пузырьков.

Практическую ценность диссертации представляет разработанный программный комплекс выявления, анализа признаков и классификации дефектов дорожного покрытия и мониторинга фазовых переходов в жидкостях. В программных комплексах реализованы вышеперечисленные методы и внедрены приложения для решения практических задач ОКДДП и ОП. Результаты исследования применены в лаборатории динамики парогенерирующих систем в ИСЭМ, получен акт о внедрении. По результатам диссертации получено три свидетельства о Государственной регистрации программ для ЭВМ.

Научные положения, выносимые на защиту:

1) Математические методы на основе марковских случайных полей и метода разреза на графах позволяющие эффективно распознавать дефекты дорожного покрытия, а также адаптация метода случайного леса для их классификации.

2) Математические методы расчета моделей пузырьков для изучения фазовых переходов «жидкость-газ».

3) Методы расчета и классификации признаков дефектов дорожного покрытия и пузырьков реализованы в виде двух научно-исследовательских комплексов программ.

Апробация работы. Работа выполнена на кафедре вычислительной техники института высоких технологий ИРНИТУ. Результаты диссертационной работы обсуждались и докладывались на следующих симпозиумах, семинарах и конференциях: Всероссийские молодежные научно-практические конференции «Винеровские чтения» (ИРНИТУ, г. Иркутск, 2014, 2015); XIX Байкальская всероссийская конференция «Информационные и математические технологии в науке и управлении» (Максимиха, Бурятия, 2014); XVI Байкальская

международная школа-семинар «Методы оптимизации и их приложения» (о. Ольхон, г. Иркутск, 2014); The 4th, 5th International Conference on Analysis of Images, Social Networks, and Texts (г. Екатеринбург, 2015, 2016); V Научно-практическая Internet-конференция «Междисциплинарные исследования в области математического моделирования и информатики» (г. Тольятти, 2015); XIII Всероссийская конференция молодых ученых «Моделирование, оптимизация и информационные технологии» (г. Иркутск - Старая Ангасолка, 2017); XVII Байкальская международная школа-семинар «Методы Оптимизации и их Приложения» (Максимиха, Бурятия, 2017). Работа выполнена при поддержке Министерства образования и подготовки кадров Социалистической Республики Вьетнам и программы развития ФГБОУ ВО ИРНИТУ.

Результаты диссертации неоднократно докладывались на научных семинарах кафедры вычислительной техники Иркутского национального исследовательского технического университета.

Личный вклад автора. Основные результаты, выносимые на защиту получены автором лично. Постановки задач и анализ результатов осуществлены совместно с научным руководителем профессором Д. Н. Сидоровым. Автор благодарен А. В. Жукову и к.ф.-м.н. А. И. Дрегля за поддержку и ценные советы. Конфликта интересов с соавторами нет.

Тематика работы соответствует следующим пунктам паспорта специальности 05.13.18:

- п.1. «Разработка новых математических методов моделирования объектов и явлений»;

- п.4. «Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента»;

- п.6 «Разработка новых математических методов и алгоритмов проверки адекватности математических моделей объектов на основе данных натурного эксперимента»;

Публикации. По теме диссертации опубликовано 12 научных работ, 8 из которых - в рецензируемых научных журналах и изданиях, рекомендованных ВАК РФ, 2 свидетельства регистрации программы на ЭВМ, 2 статьи опубликованы в журналах, индексируемых Web of Science и 3 статьи опубликованы в журналах, индексируемых Scopus.

Основные результаты исследования опубликованы в следующих работах.

Издания, входящие в Перечень ВАК РФ

1. Нгуен Т. Х. Алгоритмическое и программное обеспечение автоматического обнаружения и классификации дефектов дорожного покрытия с помощью метода разреза графов и алгоритма случайных лесов / Т. Х. Нгуен, Т. Л. Нгуен // Вестник Иркутского гос. технического ун-та. - 2016. - № 10 (117). - С. 111-118.

2. Nguyen T. H. A Robust Approach for Road Pavement Defects Detection and Classification / T. H. Nguyen, T. L. Nguyen, D. N. Sidorov // Journal of Computational and Engineering Mathematics. - 2016. - V. 3. - No. 3. - P. 40-52.

3. Nguyen T. H. On Road Defects Detection and Classification / T. H. Nguyen, T. L. Nguyen, A. Zhukov // CEUR Workshop Proceedings. - 2016. - V. 1710, - P. 264275.

4. Nguyen T. H. Machine learning algorithms application to road defects classification / T. H. Nguyen, T. L. Nguyen, D. N. Sidorov, A. I. Dreglea // Intelligent Decision Technologies. - 2018. - V. 12. - No. 1. - P. 59-66.

5. Nguyen T. H. Robust Approach to Detection of Bubbles Based on Images Analysis / T. H. Nguyen, T. L. Nguyen, A. I. Dreglea // International Journal of Artificial Intelligence. - 2018. - V. 16. - No. 1. - P. 167-177.

6. Нгуен Т. Х. Об автоматизации извлечения и классификации антропометрических признаков / Т. Л. Нгуен, Т. Х. Нгуен // Вестник Иркутского гос. технического ун-та. - 2015. - № 4 (99). - С. 17-23.

7. Nguyen T. H. Studies of Anthropometrical Features using Machine Learning Approach / T. L. Nguyen, T. H. Nguyen, A. Zhukov // CEUR Workshop Proceedings. -2015. - V. 1452. - P. 96-105.

8. Nguyen T. H. Automatic Anthropometric System Development Using Machine Learning / T. L. Nguyen, T. H. Nguyen // BRAIN. Broad Research in Artificial Intelligence and Neuroscience. - 2016. - V. 7. - P. 5-15.

Свидетельства о государственной регистрации программы для ЭВМ

9. Нгуен Т. Х. Обнаружение и классификация пузырьков на цифровых изображениях / Д. Н. Сидоров, Т. Х. Нгуен, Т. Л. Нгуен // Свидетельство о гос. регистрации программы для ЭВМ. № 2018612096 от 12 февраля 2018 г. М.: Федеральная служба по интеллектуальной собственности. 2018.

10. Нгуен Т. Х. Программа автоматического обнаружения и классификации дефектов дорожного покрытия / Д. Н. Сидоров, Т. Х. Нгуен, Т. Л. Нгуен // Свидетельство о гос. регистрации программы для ЭВМ. № 2016619386 от 18 августа 2016 г. М.: Федеральная служба по интеллектуальной собственности. 2016.

Прочие издания

11. Нгуен Т. Х. Автоматическое обнаружение и классификация дефектов дорожного покрытия / Т. Х. Нгуен // Материалы всероссийской молодежной научно-практической конференции «Винеровские чтения 2015». Иркутск: Изд-во Иркутск, 2015. - С. 8.

12. Нгуен Т. Х. Методы математической морфологии в цифровой обработке изображений / Т. Л. Нгуен, Т. Х. Нгуен // Труды XIX Байкальской Всероссийской конференции «Информационные и математические технологии в науке и управлении». Иркутск: ИСЭМ СО РАН, 2014. - С. 75-81.

Структура и объем работы. Диссертация содержит введение, три главы, заключение и список использованной литературы, содержащий 189 наименований. Общий объем диссертации составляет 133 страниц машинописного текста, иллюстрированного 57 рисунками и 12 таблицами.

Кратко изложим содержание основных разделов работы.

Глава 1. Дан обзор литературы для решения указанных задач, проведен анализ алгоритмов, методов ТЗ, представлены результаты исследований в этой области. Сформулирована постановка задачи диссертационного исследования. Представлены предлагаемые автором подходы для решения задачи автоматического обнаружения и классификации дефектов дорожного покрытия и задачи обнаружения и измерения пузырьков.

Глава 2. Представлены методы МО и ТЗ, разработаны математические модели и численные методы решения поставленных задач. Работа сфокусирована на решении следующих задач: улучшения качества входных данных посредством предварительной обработки изображений, сегментация изображений, обнаружения и классификации векторов признаков объектов.

Глава 3. Дается описание реализации алгоритмов и методов МО для построения систем ОКДДП и ОП для которых в главе 2 были разработаны соответствующие математические модели. Описана структура программ ОКДДП и ОП и приведены результаты экспериментов для оценки разработанного метода обнаружения и классификации данных на изображении. Проанализированы результаты предлагаемого метода в сравнении с другими передовыми методами. Описан интерфейс разработанного программного обеспечения.

В заключении приведены результаты работы.

1 ТЗ и МО для обнаружения и классификации дефектов дорожного

покрытия и пузырьков

В этой главе представлен краткий обзор результатов, которые успешно использованы для решения задач обнаружения и классификации дефектов на изображениях и видеопоследовательностях. Отдельное внимание уделяется методам обработки изображений, методам МО. Особое внимание уделяется трем основным этапам: предварительная обработка данных, извлечение признаков, обнаружение и классификация дефектов.

1.1 Машинное обучение: задачи и приложения

Понятие МО. Машинное обучение - обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться на ретроспективных данных [22, 176]. МО - это семейство методов создания математическим моделей использующие обучение по прецедентам или индуктивное обучение.

Область МО по своей сути направлена именно на решение практических задач, связанных с обработкой больших массивов данных. МО, являясь междисциплинарной областью, опирается на многие разделы классической математики - прежде всего математическую статистику, методы оптимизации и исследование операций.

В 1950 году Алан Тьюринг создал тест (позже получивший название теста Тьюринга), заключающийся в том, что человек, не знающий, с кем ведет диалог, должен определить, с прикладной программной искусственного интеллекта он общается или с реальным человеком [130, 160].

В настоящее время алгоритмы МО применяются для создания важных приложений во всех сферах жизни. Например, Google Brain был разработан в 2011 году для решения задач искусственного интеллекта [92]. В 2015 году Microsoft создала открытую платформу «Distributed Machine Learning Toolkit» [66], которая позволяет эффективно распределять решение задач МО на нескольких компьютерах. Внедрение методов МО позволяет повысить эффективность работы многих приложений и устройств.

Если раньше МО требовало сложного программного обеспечения, передовых компьютерных систем и опытных ученых, чтобы настроить и внедрить методы МО, то теперь разработаны высокоэффективные алгоритмы МО, которые проще настраивать и применять в конкретных областях науки и техники.

Типы задач МО. Существуют 3 основных типа задач МО: обучение с учителем, обучение без учителя, обучение с подкреплением. Обучение с подкреплением - это улучшенный тип модели обучения с учителем.

Обучение с учителем [105, 166]: Это метод МО предполагает наличие размеченных данных. Имеется множество объектов и множество возможных меток. Существует некоторая зависимость между метками и объектами, но она неизвестна. Известна только конечная совокупность прецедентов — пар «объект, метка», называемая обучающей выборкой. Задачей обучения с учителем является прогнозирование вывода на основе входного значения. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. То есть сопоставить объекту нужную метку отнеся его к определенному классу (например - дефект это или не дефект) в задаче классификации или скаляр (вектор) в задаче регрессии или прогнозирования.

Обучение с учителем применяется к основным задачам классификации и регрессии, например: прогноз цен на акции [48, 102], прогнозы погоды [184]; распознавание рукописного текста [42, 85].

Обучение без учителя [82]: это метод МО, который изучает широкий класс задач обработки данных, в которых известны только описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости, закономерности, существующие между объектами. Типичным примером обучения без учителя является задача кластеризации.

Обучение с подкреплением - это улучшенный тип модели обучения с учителем. Этот метод заключается в том, что система будет учиться в среде, взаимодействовать с ней и получать вознаграждение за выполнение действий. Обучение без учителя является наиболее распространенным применением кластеризации [65, 87, 91, 185], поиска правил ассоциации, заполнения пропущенных и т.д.

Методы МО и практическое применение. МО широко применяется во многих сферах бизнеса и жизнедеятельности: маркетинге, финансах, банковском деле, страховании, науке, здравоохранении, безопасности, Интернете и т.д. Многие организации и компании в мире применяют методы МО для максимизации прибыли и минимизации издержек. В последние время МО активно применяется для интеллектуального анализа данных и распознавания образов.

Интеллектуальный анализ данных [31, 125, 147]: В этих работах алгоритмы МО применимы к базе данных для обнаружения правил и закономерности. Интеллектуальный анализ данных это современная концепция анализа данных, предполагающая, что данные могут быть неточными, неполными, противоречивыми, разнородными, при этом иметь гигантские объёмы. Алгоритмы анализа данных могут обучаться по прецедентам, то есть делать общие выводы на основе частных наблюдений перерабатывая начальные данные в информацию, а информацию в знания автоматически. При интеллектуальном анализе данных большую роль играют методы кластеризации, позволяющие искать новые закономерности в данных большой размерности.

Распознавание образов [21, 32, 111]: это отнесение исходных данных к определенному классу с помощью выделения существенных признаков,

характеризующих эти данные, из общей массы несущественных данных для решения конкретной задачи. Распознавание образов отличается от искусственного интеллекта в исходном использовании математического языка и модели, а не путём эксперимента, заменив эксперимент логическими рассуждениями и математическими доказательствами.

Рассмотрим классическую постановку задачи распознавания образов. Дано множество объектов. Относительно них необходимо провести классификацию. Множество представлено подмножествами, которые называются классами. Заданы: информация о классах, описание всего множества и описание информации об объекте, принадлежность которого к определенному классу неизвестна. Требуется по имеющейся информации о классах и описании объекта установить к какому классу относится этот объект.

Методы МО в задачах классификации. Классификация - это одна из основных задач МО, которая сортирует объекты согласно принадлежности предопределенным классам. Формализация классов проводится на предварительном этапе. Объекты классифицируются по классам на основе значений извлеченных признаков анализируемых объектов [163]. Типичные алгоритмы классификации включают: нейронные сети, в том числе методы глубокого обучения [153], деревья решений [144, 156], байесовские сети [97], метод опорных векторов [56, 169]. Простейшим эффективным методом классификации и регрессии является метод к ближайших соседей (КМЫ) [175].

Все эти подходы создают модели, способные классифицировать неизвестные новые объекты на основе данных аналогичных объектов, по которым предварительно проводилось обучение. Изображения и видео содержат большой объем плохо структурированной информации. Поэтому необходим глубокий предварительный интеллектуальный анализ данных для создания различных приложений.

Решение задачи классификации проводится в два этапа:

Этап 1: Обучение. Цель этого этапа - построить модель для определения набора классов данных. Эта модель строится путем анализа наборов обучающих данных, каждый из которых определяется значением признаков. Каждый набор данных относится к одному из предопределенных классов. Набор данных анализируется для построения модели классификации.

Этап 2: Тестирование и оценка. На этом этапе используется модель классификации, полученная на шаге 1. Сначала оценивается точность модели с помощью тестовых наборов. Эти наборы выбираются независимо от образцов, которые были изучены на шаге 1. Количество правильно классифицированных объектов - это точность модели классификатора, основанная на тестовых данных. Важнейшим функционалом оценки качества классификации является ROC кривая [90] (см. ниже п.3.2 раздела 3.2.1, стр. 83).

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Список литературы диссертационного исследования кандидат наук Нгуен Тху Хыонг, 2019 год

Список литературы

1. Абрамов, Н. С. Распознавание на основе инвариантных моментов [Text] / Н. С. Абрамов, В. М. Хачумов // Информационные технологии. — 2014. — № 2. — С. 142-149.

2. Белоусов, А. А. Применение генетических алгоритмов и вейвлетпреобразований для повышения качества изображений [Текст] / А. А. Белоусов, В. Г. Спицын, Д. В. Сидоров // Известия Томского политехнического университета. — 2006. — Т. 309. — С. 21-26.

3. Голубев, М. Н. Использование информации о цвете в алгоритме выделения лиц на базе бустинга [Text] / М. Н. Голубев // Нейроинформатика. — 2011. — Т. 3. — С. 55-62.

4. Гонсалес, Р. Цифровая обработка изображений [Текст] / Р. Гонсалес, Р. Вудс // Техносфера. — 2005. — С. 1072.

5. ГОСТ Р 50597 93 Автомобильные дороги и улицы требования эксплуатационному состоянию, допустимому по условиям обеспечения безопасности дорожного движения [Электронный ресурс] // [http://internetlaw.ru/gosts/gost/832/]. — [Б. м. : б. и.]. — Дата доступа: 2017.

6. Коллективные метод, бэггинг, бустинг, голосование по системам закономерностей [Электронный ресурс] // [http://www.machinelearning.ru/wiki/ images/6/66/MOTP14 10.pdf.]. — [Б. м. : б. и.]. — Дата доступа: 2017.

7. Крылов, А. Алгоритмы детектирования разметки и дефектов дорожного покрытия [Текст] / А. Крылов, С. Судаков, В. Киншаков [et al.] // Труды 18-й Международной конференции по компьютерной графике и зрению «ГрафиКон 2008». — 2008. — С. 206-212.

8. Кузьмин, Д. М. Технология и методы интеллектуального мониторинга автотранспортных потоков и состояния автомобильных дорог. [Text] / Д. М. Кузьмин. — 2008. — С. 191.

9. Лемперт, А. А. Алгоритм построения оптимальных покрытий равными кругами невыпуклых многоугольников с неевклидовой метрикой [Текст] / А. А. Лемперт, А. Л. Казаков, Г. Л. Нгуен // Вестник Иркутского гос. технического ун-та.

— 2016. — Т. 112. — С. 45-55.

10. Лемперт, А. А. Об одном алгоритме построения упаковки конгруэнтных кругов в неодносвязное множество с неевклидовой метрикой [Текст] / А. А. Лемперт, А. Л. Казаков, Г. Л. Нгуен // Вычислительные методы и программирование. — 2016. — Т. 17. — С. 177-188.

11. Лемперт, А. А. Об одном подходе к оптимизации ремонта автомобильных дорог в условиях ограниченного финансирования [Текст] / А. А. Лемперт, Д. Н. Сидоров, А. В. Жуков // Обобщенные постановки и решения задач управления: сб. тр. Междунар. симпозиума. М: ФИЗМАТЛИТ. — 2014. — С. 114-118.

12. Лемперт, А. А. Оптимизация системы коммуникаций с учетом региональных особенностей: математическая модель и численный метод [Текст] / А. А. Лемперт, А. Л. Казаков, Г. Л. Нгуен // Вестник Иркутского гос. технического ун-та. — 2014. — Т. 95. — С. 17-22.

13. Нгуен, Т. Л. Автоматизация антропометрических измерений и извлечение признаков из 2D-изображений [Text] / Т. Л. Нгуен, Т. Х. Нгуен // XVI Байкальская международная школа-семинар «Методы оптимизации и их приложения». — 2014.

— С. 153.

14. Нгуен, Т. Л. Анализ антропометрических признаков с использованием методов машинного обучения [Text] / Т. Л. Нгуен, Т. Х. Нгуен // Междисциплинарные исследования в области математического моделирования и информатики. Ульяновск: Изд-во SIMJET. — 2014. — Т. 11. — С. 204-210.

15. Нгуен, Т. Л. Об автоматизации извлечения и классификации антропометрических признаков [Text] / Т. Л. Нгуен, Т. Х. Нгуен // Вестник Иркутского гос. технического ун-та. — 2015. — Т. 99. — С. 17-23.

16. Нгуен, Т. Л. Построение программы для обнаружения контуров человека в изображении с помощью методов математической морфологии [Text] / Т. Л. Нгуен, Т. Х. Нгуен // Материалы всероссийской молодежной научно-практической конференции «Винеровские чтения 2014». — 2014. — С. 10.

17. Нгуен, Т. Х. О распознавании и классификации дефектов дорожного покрытия на основе изображений [Текст] / Т. Х. Нгуен, Т. Л. Нгуен // Вестник ИРНИТУ. — 2016. — № 10. — С. 111-118.

18. Сидоров, Д. Н. Методы анализа интегральных динамических модели: теория приложения. [Text] / Д. Н. Сидоров // Издательство ИГУ. — 2013. — С. 295

19. 1472 /QD-BGTVT [Electronic resource] // [https://m.thuvienphapluat.vn/vanban/giao-thong-van-tai/quyet-dinh-1472-qd-bgtvt-2017]. — [S. l. : s. n.]. — Дата доступа: 2017.

20. Abaza, K A. Integrated Pavement Management System with a Markovian Prediction Model [Text] / K A. Abaza, S. A. Ashur, I. A. A. Khatib // Journal of Transp. Eng. — 2004. — Vol. 130, no. 1. — P. 24-33.

21. Abebe, G. Robust multi-dimensional motion features for first-person vision activity recognition [Text] / G. Abebe, A. Cavallaro, X. Parra // Computer Vision and Image Understanding. — 2016. — Vol. 149. — P. 229-248.

22. Alpaydin, E. Introduction to Machine Learning [Text] / E. Alpaydin. — LonDon, UK : [s. n.], 2009. — P. 584.

23. Aran. Fugro Automatic Road Analyzer [Electronic resource] // [http://www. roadware.com/products/9000.]. — USA : [s. n.]. — Дата доступа: 2011.

24. Archit, Y. Approximation of a Signal Using Discrete Wavelets Transform [Text] / Y. Archit, R. S. Mohan // International Journal of Artificial Intelligence. — 2009. — Vol. 2. — P. 95 - 105.

25. Arques, P. Minimization of an energy function with robust features for image segmentation [Text] / P. Arques, P. Compan, R. Molina [et al.] // Kyberneters. — 2003.

— Vol. 32. — P. 1481-1491.

26. Attas, R. A. Thresholding of Medical Images Using Minimum Cross Entropy [Text] / R. A. Attas, A. E. Zaar // International Conference on Biomedical Engineering.

— 2006. — P. 296-299.

27. Banister, D. Sustainable cities: transport, energy, and urban form [Text] / D. Banister, S. Watson, C. Wood // Environment and Planning B: Planning and Design. — 1997. — Vol. 24. — P. 125- 143.

28. Barinova, O. Efficient road mapping via interactive image segmentation [Text] / O. Barinova, R. Shapovalov, S. SudakovS [et al.] // IAPRS. — 2009. — Vol. 38, no. 4.

— P. 1-6.

29. Barker, S. A. Unsupervised image segmentation using Markov random fields models [Text] / S. A. Barker, P. J. W. Rayner // Pattern Recognition. — 2000. — Vol. 33. — P. 587-602.

30. Bauer, E. An empirical comparison of voting classification algorithms: Bagging, boosting, and variants [Text] / E. Bauer, R. Kohavi // Machine Learning. — 1999. — Vol. 36, no. 1. — P. 105-139.

31. Bertrand, C. Principles and Theory for Data Mining and Machine Learning [Text] / C. Bertrand, F. Ernest, H. H. Zhang. — New York : Springer Press2009, 2009.

— P. 786. — ISBN: 978-0-387-98135-2.

32. Bishop, C. Pattern Recognition and Machine Learning [Text] / C. Bishop. — [S. l.] : Springer Press-2006, 2006. — P. 738.

33. Boykov, Y. An experimental comparison of min-cut/max- flow algorithms for energy minimization in vision [Text] / Y. Boykov, V. Kolmogorov // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2004. — Vol. 9. — P. 1124-1137.

34. Boykov, Y. An experimental comparison of min-cut/maxflow algorithms for energy minimization in vision [Text] / Y. Boykov, V. Kolmogorov // International

Workshop on Energy Minimization Methods in Computer Vision and Pattern Recognition. — 2001. — Vol. 2134. — P. 359-374.

35. Boykov, Y. Fast approximate energy minimization via graph cuts [Text] / Y. Boykov, O. Veksler, R. Zabih // TPAMI. — 2001. — Vol. 11. — P. 1222-1239.

36. Boykov, Y. Interactive graph cuts for optimal boundary and region segmentation of objects in N-D images [Text] / Y. Boykov, M. P. Jolly // ICCV. — 2001. — P. 105112.

37. Bramer, M. Using Decision Trees for Classification [Text] / M. Bramer // Springer. — 2016. — P. 39-48.

38. Bray, J. A neural network based technique for auto-matic classification of road cracks [Text] / J. Bray, B. Verma, X. Li [et al.] // Neural Networks, IJCNN'06. — 2006.

— P. 907-912.

39. Breiman, L. Bagging predictors [Text] / L. Breiman // Machine Learning. — 1996. — Vol. 24, no. 2. — P. 123-140.

40. Breiman, L. Random forests [Text] / L. Breiman // Machine learning. — 2001.

— Vol. 1. — P. 5-32.

41. Bruijne, M. D. Machine learning approaches in medical image analysis: From detection to diagnosis [Text] / M. D. Bruijne // JACR - Medical image analysis. — 2016.

— Vol. 33. — P. 94-97.

42. Cakmakov, D. Handwritten Digit Recognition Using Classifier Cooperation Schemes [Text] / D. Cakmakov, D. Gorgevik // Proceedings of the 2nd Balkan Conference in Informatics. — 2015. — P. 23-30.

43. Campbell, N. D. F. Automatic 3D object segmentation in multiple views using volumetric graph-cuts [Text] / N. D. F. Campbell, G. Vogiatzis, C. Hernandez //' Elsevier. Image and Vision Computing. — 2010. — Vol. 28. — P. 14 - 25.

44. Canny, J. A computational approach to edge detection [Text] / J. Canny // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 1986. — Vol. 8. — P. 679-698.

45. Center for Telecommunications and Multimedia, INESC TEC [Electronic resource] // [https://www.inesctec.pt/en/centres/ctm?p=9605.]. — Portugal : [s. n.]. — Дата доступа: 2015.

46. Chai, J. Analysis of road transportation energy consumption demand in China [Text] / J. Chai, Q. Y. Lu, S. Y. Wang, K. K. Lai // Transportation Research Part D: Transport and Environment. — 2016. — Vol. 48. — P. 112 - 124.

47. Chambon, S. Introduction of a wavelet transform based on 2D matched filter in a Markov randomfield for fine structure extraction: Application on road crack detection [Text] / S. Chambon, P. Subirats, J. Dumoulin // in Proc. IST/SPIE Electron. Imag. Sci. Technol., San Jose, CA. — 2009. — P. 725.

48. Chen, A. S. Application of neural networks to an emerging financial market: forecasting and trading the Taiwan Stock Index [Text] / A. S. Chen, M. T. Leung, H. Daouk // Computers Operations Research. — 2003. — Vol. 30. — P. 901-923.

49. Chen, C. C. Modeling human activities as speech [Text] / C. C. Chen, J. K. Aggarwal // Computer Vision and Pattern Recognition (CVPR) 2011 IEEE Conference on. — 2011. — P. 3425-3432.

50. Chen, H. H. Automatic pavement distress detection system [Text] / H. H. Chen, M. M. Miyojim // Journal of information Sciences. — 1998. — Vol. 108. —P. 219-240.

51. Cheng, H. D. Novel approach to pavement cracking detection based on fuzzy set theory [Text] / H. D. Cheng // in Journal of Computing In civil Enginering. — 1999. — Vol. 13, no. 4. — P. 270-280.

52. Cheng, H. Novel approach to pavement cracking detection based on neural network [Text] / H. Cheng, J. Wang, Y. Hu [et al.] // Transportation Research Record. — 2001. — Vol. 1764. — P. 119-127.

53. Chinu, A. C. Overview and Comparative Analysis of Edge Detection Techniques in Digital Image Processing. [Text] / A. C. Chinu // Intern. J. Inform. Comput. Technol. — 2014. — Vol. 4. — P. 973-980.

54. Chua, K. M. Simple procedure for identifying pavement distresses from video images [Text] / K. M. Chua, L. Xu // Journal of transportation engineering. — 1994. — P. 412-431.

55. Cord, A. Automatic road defect detection by textural pattern recognition based on AdaBoost [Text] / A. Cord, S. Chambon // Computer-Aided Civil and Infrastructure Engineering. — 2012. — Vol. 27, no. 4. — P. 244-259.

56. Cortes, C. Support-vector networks [Text] / C. Cortes, V. Vapnik // Machine Learning. — 1995. — Vol. 20, no. 3. — P. 273-297.

57. Criminisi, A. Machine learning for medical images analysis [Text] / A. Criminisi // JACR - Medical image analysis. — 2016. — Vol. 33. — P. 91-93.

58. Csiro RoadCrack Specifications [Electronic resource] // [http://www.csiro.au/en/Research/MF/Areas/Innovation/Prototvping/Road-Crack-Detection.]. — USA : [s. n.]. — Дата доступа: 2016.

59. Dalal, N. Histograms of Oriented Gradients for Human Detection [Text] / N. Dalal, B. Triggs // IEEE Computer Society Conference on Computer Vision and Pattern Recognition. — 2005. — Vol. 1. — P. 886-893.

60. Daubechies, I. Orthonormal Bases of compactly supported wavelets. [Text] / I. Daubechies // Comm. PureAppl. Math. — 1988. — Vol. 41. — P. 909-996.

61. Deng, L. Machine Learning Paradigms for Speech Recognition: An Overview [Text] / L. Deng, X. Li // IEEE Transactions on Audio, Speech, and Language Processing. — 2013. — Vol. 21. — P. 1060-1089.

62. Derin, H. Modeling and segmentation of noisy and textured images using Gibbs random fields [Text] / H. Derin, H. Elliott // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 1987. — Vol. 9. — P. 39-55.

63. Dhdv. WayLink Digital Highway Data Vehicle [Electronic resource] // [http: //www.waylink.com/DHDV.htm. ]. — USA : [s. n.]. — Дата доступа: 2011.

64. Dietterich, T. G. An experimental comparison of three methods for constructing ensembles of decision trees: bagging, boosting, and randomization [Text] / T. G. Dietterich // Machine Learning. — 2000. — Vol. 40. — P. 139-157.

65. Ding, C. Cluster merging and splitting in hierarchical clustering algorithms [Text] / C. Ding, X. He // IEEE International Conference on Data Mining. — 2002. — P. 139.

66. Dmtk [Electronic resource] // [https: //www.dmtk.io/document.html.]. — USA : [s. n.]. — Дата доступа: 2011.

67. Dominguez, R. A. Automated recognition of oil drops in images of multiphase dispersions via gradient direction pattern [Text] / R. A. Dominguez, G. Corkidi // CISP 3. — 2011. — P. 1209-1213.

68. Dominguez, R. A. Automated recognition of oil drops in images of multiphase dispersions via gradient direction pattern [Text] / R. A. Dominguez, G. Corkidi // CISP. — 2011. — Vol. 3. — P. 1209-1213.

69. Downey, A. Analysis of Segmentation Algorithms for Pavement Distress Images [Text] / A. Downey, H. Koutsopoulos, I. el sanhouri. — 1993. — Vol. 119. — P. 869 - 888.

70. Elbehiery, H. Surface defects detection for ceramic tiles using image processing and morphological techniques [Text] / H. Elbehiery, A. Hefnawy, M. Elewa // Proceedings of World Academy of Science, Engineering and Technology. — 2005. — Vol. 5. — P. 158-162.

71. EN 13108-4 [Electronic resource] // [https://www.en-standard.eu/csn-en-13108-4-bituminous-mixtures-material-specifications-part-4-hot-rolled-asphalt/]. — [S. l. : s. n.]. — Дата доступа: 2006.

72. Facebook [Electronic resource] // [https://facebook.com. ]. — USA : [s. n.]. — Дата доступа: 2017.

73. Fase, I. Experiments with a new Boosting Algorithm [Electronic resource] // [https://cseweb.ucsd.edu/classes/fa01/cse291/AdaBoost.pdf.]. — USA : [s. n.]. — Дата доступа: 2001.

74. Filho, E. Toward a method for automatic grading of microscope human embryo images [Text] / E. Filho, J. Noble, D. Wells // IEEE International symposium on biomedical imaging. — 2010. — P. 1289-1292.

75. Freeman, H. Computer processing of line-drawing images [Text] / H. Freeman // Computing Surveys. — 1974. — Vol. 1. — P. 57-97.

76. Freeman, H. Generalized chain codes for planar curves [Text] / H. Freeman, A. Saghri // Proceedings of the 4th International Joint Conference on Pattern Recognition. — 1978. — P. 701-703.

77. Friedman, N. Bayesian network classifiers [Text] / N. Friedman, D. Geiger, M. Goldszmidt // Machine Learning. — 1997. — Vol. 29. — P. 131-163.

78. Galambos, C. Progressive probabilistic Hough transform for line detection [Text] / C. Galambos, J. Kittler, J. Matas // Computer Vision and Pattern Recognition. — 1999. — Vol. 1554. — P. 1090-1095.

79. Gang, L. Automatic Recognition Algorithm of Pavement Defect Image Based on OTSU and Maximizing Mutual Information [Text] / L. Gang, H. Yu-yao, Z. Yan // Microelectronics Computer. — 2009. — Vol. 7. — P. 241-247.

80. Gavilan, M. Adaptive Road Crack Detection System by Pavement Classification [Text] / M. Gavilan, D. Balcones, O. Marcos // Sensors. — 1999. — Vol. 11, no. 10. — P. 9628-9657.

81. Geman, S. Neural networks and the bias/variance dilemma [Text] / S. Geman, E. Bienenstock, R. Doursat // Neural Computation. — 1992. — Vol. 4. — P. 1-58.

82. Gentleman, R. Unsupervised Machine Learning [Text] / R. Gentleman, V. J. Carey // Springer. — 2008. — P. 137-157.

83. Gie. Technologies Laservision [Electronic resource] // [http: //www.gieinc.ca/ main_en.html.]. — USA : [s. n.]. — Дата доступа: 2011.

84. Google [Electronic resource] // [https://google.com.]. — USA : [s. n.]. — Дата доступа: 2017.

85. Gorgevik, D. An Efficient Three- Stage Classifier for Handwritten Digit Recognition [Text] / D. Gorgevik, D. Cakmakov // IEEE Computer Society. — 2004. — P. 507-510.

86. Graph Cut for image Segmentation [Electronic resource] //

[https: //ch.mathworks .com/matl abcentral/fi l eexchan ge/ 40669-graph-cut-for-image-segmentation.]. — [S. l. : s. n.]. — Дата доступа: 2014.

87. Greene, D. Unsupervised Learning and Clustering [Text] / D. Greene, C. Padraig, R. Mayer // Springer. — 2008. — P. 51-90.

88. Guo, F. A novel multi-scale edge detection technique based on wavelet analysis with application in multiphase flows [Text] / F. Guo, Y. Yang, B. Chen, B, L. Guo // Powder Technology. — 2010. — Vol. 202 — P. 171 - 177.

89. Haddad, R. A. A Class of Fast Gaussian Binomial Filters for Speech and Image Processing [Text] / R. A. Haddad, A. N. Akansu // IEEE Transactions on Acoustics, Speech and Signal Processing. — 1991. — Vol. 39. — P. 723-727.

90. Hanley, J. A. The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve. [Text] / J. A. Hanley, B. J. McNeil // Radiology. — 1982. — P. 29-36.

91. Hautamaki, V. Improving k-means by outlier removal [Text] / V. Hautamaki, S. Cherednichenko, I. Karkkainen [et al.] // In Image Analysis. — 2005. — P. 978-987.

92. Hinton, G. Deep neural networks for acoustic modeling in speech recognition: the shared views of four research groups [Text] / G. Hinton, L. Deng, D. Yu [et al.] // IEEE Signal Process. — 2012. — Vol. 29, no. 6. — P. 82-97.

93. Ho, T. K. Random Decision Forests (PDF). [Text] / T. K. Ho // Proceedings of the 3rd International Conference on Document Analysis and Recognition. — 1995. — P. 278-282.

94. Hou, Z. Experimentation of 3D Pavement Imaging through Stereovision [Text] / Z. Hou, K. C. Wang, W. and Gong // Proc. of Intl. Conference on Transportation Engineering. — 2007. — P. 376-381.

95. Hu, R. M. Texture segmentation based on a hierarchical MArkov random field model [Text] / R. M. Hu, M. M. Fahmy // Signal Processing. — 1992. — Vol. 26. — P. 285-305.

96. Hu, Y. A local binary pattern based methods for pavement crack detection [Text] / Y. Hu, C. Zhao // Journal of Pattern Recognition Research. — 2013. — Vol. 1. — P. 140-147.

97. Hugh, A. C. Bayesian CART model search [Text] / A. C. Hugh, I. George, R. E. McCulloch // Journal of the American Statistical Association. — 1998. — P. 935-948.

98. Iivarinen, J. Shape recognition of irregular objects [Text] / J. Iivarinen // Intelligent Robots and Computer Vision. — 1996. — P. 25-32.

99. Jordt, A. The Bubble Box: Towards an Automated Visual Sensor for 3D Analysis and Characterization of Marine Gas Release Sites [Text] / A. Jordt, C. Zelenka, J. Schneider // Sensors. — 2015. — Vol. 12. — P. 30716-30735.

100. Kaseko, M. S. A neural network-based methodology for pavement crack detection and classification [Text] / M. S. Kaseko, S. G. Ritchie // Transportation Research Part C: Emerging Technologies. — 1993. — Vol. 1, no. 4. — P. 275-291.

101. Kim, H. J. MRF model based image segmentation using hierarchical distributed genetic algorithm [Text] / H. J. Kim, E. Y. Kim, J. W. Kim // Electronic Letters. — 1998.

— Vol. 35. — P. 2394-2395.

102. Kim, K. J. Financial time series forecasting using support vector machines [Text] / K. J. Kim // Neurocomputing. — 2003. — Vol. 55. — P. 307-319.

103. Kirschke, K. R. Histogram based approach for automated pavement crack sensing [Text] / K. R. Kirschke, S. A. Velinsky // Journal of Transportation Engineering.

— 1992. — Vol. 118, no. 5. — P. 700-710.

104. Koch, C. Improving Pothole Recognition through Vision Tracking for Automated Pavement Assessment [Text] / C. Koch, I. Brilakis // Conference or Workshop Item. — 2011. — P. 1-8.

105. Kotsiantis, S. B. Supervised machine learning: A review of classification techniques [Text] / S. B. Kotsiantis // MathSciNet. — 2007. — Vol. 31. — P. 249- 268.

106. Koutsopoulos, H. N. Primitive-based classification of pavement cracking images [Text] / H. N. Koutsopoulos, A. B. Downey // Journal of Transportation Engineering. — 1993. — Vol. 119. — P. 402-418.

107. Kubat, M. Addressing the curse of imbalanced data sets: One-sided sampling [Text] / M. Kubat, S. Matwin // International conference on Machine Learning. — 1997.

— P. 179-186.

108. Langley, P. An analysis of Bayesian classifiers [Text] / P. Langley, W. Iba, K. Thompson // Proc. 10th Nat. Conf. Artificial Intelligence, AAAI Press and MIT Press. — 1992. — P. 223-228.

109. Lee, B. .J. A Robust Position Invariant Artificial Neural Network for Digital Pavement [Text] / B. .J. Lee. — [S. l. : s. n.], 2002.

110. Levin, A. A. Experimental observation of the maximum bubble diameter in non-stationary temperature field of subcooled boiling water flow [Text] / A. A. Levin, P. V. Khan // International Journal of Heat and Mass Transfer. — 2018. — Vol. 124. — P. 876-883.

111. Li, H. An efficient multimodal 2D + 3D feature-based approach to automatic facial expression recognition [Text] / H. Li, H. Ding, D. Huang // Computer Vision and Image Understanding. — 2015. — Vol. 140. — P. 83-92.

112. Li, M. SAR image segmentation based on mixture context and wavelet hiddenclass-label Markov random field [Text] / M. Li, Y. Wu, Q. Zhang // Computer Mathematics with Apllication. — 2009. — Vol. 57. — P. 961-969.

113. Li, M. Xuand D. R. Multiscale MRF based texture segmentation of SAR image [Text] / M. Xuand D. R. Li, H. Sun // Chinese journal of Electronics. — 2004. — Vol. 13. — P. 671-675.

114. Li, Q. A real-time 3D Scanning System for Pavement Distortion Inspection [Text] / Q. Li, M. Yao, X. Yao [et al.] // Measurement Science and Technology. — 2010.

— P. 1-9.

115. Li, X. Toward a mobile crowdsensing system for road surface assessment [Text] / X. Li, D. W. Goldberg // Computers, Environment and Urban System. — 2018.

— Vol. 69. — P. 51- 62.

116. Liu, K. Impact of road gradient on energy consumption of electric vehicles [Text] / K. Liu, T. Yamamoto, Ta. Morikawa // Transportation Research Part D: Transport and Environment. — 2017. — Vol. 54. — P. 74 - 81.

117. Louppe, L. Wehenkel, A. Sutera, P. Geurts. Understanding variable importances in forests of randomized trees [Text]// Proceeding NIPS'13. — 2013. — Vol. 1. — P. 431 - 439.

118. Lowe, D. G. Distinctive Image Features from Scale-Invariant Keypoints [Text] / D. G. Lowe // International Journal of Computer Vision. — 2004. — Vol. 60. —P. 91110.

119. Lu, J. Discrete gradient method in solid mechanics [Text] / J. Lu, J. Qian, W. Han // International journal for numerical methods in engineering. — 2007. —P. 123131.

120. Luin, B. Modeling the impact of road network configuration on vehicle energy consumption [Text] / B. Luin, S. Petelin, F. Al Mansour // Energy. — 2017. — Vol. 137. — P. 260 - 271.

121. Ma, C. Pavement distress detection based on nonsubsampled contourlet transform [Text] / C. Ma, C. Zaho, Y. Hou // in Proc. IEEE Int. CSSE. — 2008. — P. 2831.

122. Ma, L. Iris recognition using circular symmetric filters [Text] / L. Ma, Y. Wang, T. Tan // Proceedings of the 16th International Conference on Pattern Recognition. — 2002. — Vol. 2. — P. 414 - 417.

123. Maier, H. R. Neural network models for forecasting univariate time series [Text] / H. R. Maier, G. C. Dandy // Neural Net. World. — 1996. — Vol. 5. — P. 747771.

124. Makhmalbaf, A. 2D Vision Tracking Methods Performance Comparison for 3D Tracking of Construction Resources [Text] / A. Makhmalbaf, M. W. Park, J. Yang [et al.] // Proc. of Construction Research Congress. — 2010. — P. 459- 469.

125. Maloof, M. A. Machine Learning and Data Mining for Computer Security [Text] / M. A. Maloof. — [S. l.] : Springer Press-2006, 2006. — P. 210. — ISBN: 9781-84628-253-9.

126. Melgani, F. A Markov random field approach to spatio-temporal contextual image classification [Text] / F. Melgani, S. B. Serpico // IEEE Transactions on Geoscience and Remote Sensing. — 2003. — Vol. 41. — P. 2478-2487.

127. Mladenic, D. Feature Selection for Unbalanced Class Distribution and Naive Bayes [Text] / D. Mladenic, M. Grobelnik // In Proceedings of the 16th International Conference on Machine Learning. — 1999. — P. 258-267.

128. Mohajeri, M. H. An Operating System of Pavement Distress Diagnosis by Image Processing [Text] / M. H. Mohajeri, P. J. Manning // Transportation Research Record. — 1991. — P. 120-130.

129. Nejad, F. M. An optimum feature extraction method based on wavelet-Radon transform and dynamic neural network for pavement distress classification [Text] / F. M. Nejad, H. Zakeri // Expert Syst. Appl. — 2011. — Vol. 8. — P. 9442-9460.

130. Newman, M. H. A. Alan Mathison Turing [Text] / M. H. A. Newman // Biographical Memoirs of Fellows of the Royal Society. — 1955. — Vol. 1. — P. 253-266.

131. Nguyen, S. T. Detection of defects in road surface by a vision system [Text] / S. T. Nguyen, M. Avila ans S. Begot // IEEE Mediterranean Electrotechnical Conference MELECON. — 2008. — P. 847-851.

132. Nguyen, T. Automatic detection and classification of defect on road pavement using anisotropy measure [Text] / T. Nguyen, M. Avila, B. Stephane // in Proc.17th EUSIPCO. — 2009. — P. 617-621.

133. Nguyen, T. H. A Robust Approach for Road Pavement Defects Detection and Classification. [Text] / T. H. Nguyen, T. L. Nguyen, D. N. Sidorov // Journal of Computational and Engineering Mathematics. — 2016. — Vol. 3. — P. 40-52.

134. Nguyen, T. H. Machine learning algorithms application to road defects classification. [Text] / T. H. Nguyen, T. L. Nguyen, D. N. Sidorov, A. I. Dreglea // Intelligent Decision Technologies. — 2018. — Vol. 12. — P. 59-66.

135. Nguyen, T. H. On Road Defects Detection and Classification [Text] / T. H. Nguyen, T. L. Nguyen, A. Zhukov // Supplementary Proceedings of the 5th International Conference on Analysis of Images, Social Networks and Texts (AIST 2016). — 2016. — Vol. 1710. — P. 266-278.

136. Nguyen, T. H. Robust Approach to Detection of Bubbles Based on Images Analysis. [Text] / T. H. Nguyen, T. L. Nguyen, A. I. Dreglea // International Journal of Artificial Intelligence. — 2018. — Vol. 16. — P. 167-177.

137. Nguyen, T. L. Automatic Anthropometric System Development Using Machine Learning [Text] / T. L. Nguyen, T. H. Nguyen // Broad Research in Artificial Intelligence and Neuroscience. — 2015. — Vol. 7. — P. 5-15.

138. Nguyen, T. L. Studies of Anthropometrical Features using Machine Learning Approach [Text] / T. L. Nguyen, T. H. Nguyen // CEUR Workshop Proceedings. — 2015.

— Vol. 1452. — P. 96-105.

139. Ningde, Z. Wenyinand J. Bubble image segmentation of gas/liquid two-phase flow based on improved canny operator [Text] / Z. Wenyinand J. Ningde, L. Xia [et al.] // Int. Conf. Comput. Sci. Softw. Eng. — 2008. — Vol. 1. — P. 799-801.

140. Ouma, Y. O. On the optimization and selection of wavelet texture for feature extraction from high-resolution satellite imagery with application towards urban-tree delineation [Text] / Y. O. Ouma, T. G. Ngigi, R. Tateishi // Int. J. Remote Sens. — 2006.

— Vol. 1. — P. 73-104.

141. Ouyang, A. Surface Distresses Detection of Pavement Based on Digital Image Processing [Text] / A. Ouyang, C. Luo, C. Zhou // Advances in Information and Communication Technology. — 2011. — P. 368-375.

142. Palanisamy, C. Wavelet Based Fuzzy Clustering of Higher Dimensional Data [Text] / C. Palanisamy, S. Selvan // International Journal of Artificial Intelligence. — 2009. — Vol. 2. — P. 27 - 36.

143. Panjwani, D. K. Markov random field models for unsupervised segmentation of textured color images [Text] / D. K. Panjwani, G. Healey // IEEE Trans. on Pattern Analysis and Machine Intelligence. — 1995. — P. 939-954.

144. Papagelis, A. Breeding Decision Trees Using Evolutionary Techniques [Text] / A. Papagelis, D. Kalles // Proceedings of the Eighteenth International Conference on Machine Learning. — 2001. — P. 393-400.

145. Patrick, L. C. A Convolutional Neural Network Approach for Objective Video Quality Assessment [Text] / L. C. Patrick, C. L. Gaudin, D. Barba // IEEE Transactions on Neural Networks. — 2006. — Vol. 5. — P. 1316-1327.

146. Paz, C. On the Application of Image Processing Methods for Bubble Recognition to the Study of Subcooled Flow Boiling of Water in Rectangular Channels [Text] / C. Paz, M. Conde, J. Porteiro. — [S. l. : s. n.], 2017. — Vol. 6. — P. 1448.

147. Perner, P. Machine Learning and Data Mining in Pattern Recognition [Text] / P. Perner. — [S. l.] : Springer Press-2016, 2016. — P. 807. — ISBN: 978-3-319419206.

148. Poletaev, I. E. Artificial neural network for bubbles pattern recognition on the images [Text] / I. E. Poletaev, K. S. Pervunin, M. P. Tokarev // Journal of Physics. — 2016. — Vol. 754. — P. 1-19.

149. Quinlan, J. R. Induction of decision trees [Text] / J. R. Quinlan // Machine Learning. — 1986. — Vol. 1. — P. 81-106.

150. Randiha, K. Circle detection in pulsative medical video sequence [Text] / K. Randiha, R. Benes // Proceedings of the 10th international conference on signal processing. — 2010. — P. 674-677.

151. Randomforest [Electronic resource] // [http s://ch.mathworks .com/ matl abcentral/fi l eexchan ge/44121 -randomforest-example.]. — [S. l. : s. n.]. — Дата доступа: 2013.

152. Ravindra, K. A. Network Flows: Theory, Algorithms, and Applications [Text] / K. A. Ravindra, T. L. Magnanti, J. B. Orlin. — [S. l. : s. n.], 1993. — P. 864. — ISBN: 013617549X.

153. Richard, A. A bag-of-words equivalent recurrent neural network for action recognition [Text] / A. Richard, J. Gall // Computer Vision and Image Understanding. — 2017. — Vol. 156. — P. 79-91.

154. Ripley, B. Neural Networks and Related Methods for Classification [Text] / B. Ripley // Journal of Royal Statistical Society. — 1994. — Vol. 56, no. 3. —P. 409-456.

155. Roadware Group Inc, Wisecrax data sheet [Electronic resource] // [http://www.roadware.com/related/down-loads/WiseCrax-Brochure.]. — USA : [s. n.].

— Дата доступа: 2004.

156. Rokach, L. Top-down induction of decision trees classifiers-a survey [Text] / L. Rokach, O. Maimon // IEEE Transactions on Systems, Man, and Cybernetics. — 2005.

— Vol. 35, no. 4. — P. 476-487.

157. Roli, F. Measure of texture anisotropy for crack detection on textured surfaces [Text] / F. Roli // Electronics Letters. — 1996. — Vol. 32. — P. 1274-1279.

158. Rst Ramboll. Pavue-Crack Recognition System [Electronic resource] // [http:// rst.ramboll. se/produkter/rst%20pavue.]. — USA : [s. n.]. — Дата доступа: 2011.

159. Sammut, C. Bias-variance decomposition, In Encyclopedia of Machine Learning [Text] / C. Sammut, I. Geoffrey // Springer. — 2011. — P. 100-110.

160. Samuel, A. Some Studies in Machine Learning Using the Game of Checkers [Text] / A. Samuel // IBM Journal. — 1959. — Vol. 3, no. 3. — P. 210-229.

161. Schapire, R. E. Boosting the mar-gin: A new explanation for the effectiveness of voting methods [Text] / R. E. Schapire, Y. Freund, P. Bartlett // Machine Learning. — 1997. — Vol. 26, no. 5. — P. 1651-1686.

162. Shyu, M. L. A novel anomaly detection scheme based on principal component classifier [Text] / M. L. Shyu, S. C. Chen, K.!Sarinnapakorn [et al.] // Proceedings of the IEEE Foundations and New Directions of Data Mining Workshop. — 2003. — P. 172179.

163. Sidorov, D. N. Automatic defects classification with p-median clustering technique [Text] / D. N. Sidorov, W. S. Wei, Igor Vasil' [et al.] // 10th International

Conference on Control, Automation, Robotics and Vision, {ICARCV} 2008, Hanoi, Vietnam, 17-20 December 2008, Proceedings. —2008—P.775-780

164. Sidorov, D. N. Suppression of moire patterns via spectral analysis [Text] / D. N. Sidorov, A. C. Kokaram // Visual Communications and Image Processing. — 2002.

— Vol. 4671. — P. 12.

165. Strobl, C. An Introduction to Recursive Partitioning: Rationale, Application and Characteristics of Classification and Regression Trees, Bagging and Random Forests [Text] / C. Strobl, J. Malley, G. Tutz // Psychological Methods. — 2009. — Vol. 14, no. 4. — P. 323-348.

166. Suthaharan, S. Supervised Learning Algorithms [Text] / S. Suthaharan // Springer. — 2016. — Vol. 36. — P. 183-206.

167. Szeliski, R. A comparative study of energy minimization methods for Markov random fields with smoothness based priors [Text] / R. Szeliski, R. Zabih, D. Scharstein // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2008. — Vol. 6.

— P. 1068-1080.

168. Taboada, B. Semiautomatic image analysis methodology for the segmentation of bubbles and drops in complex dispersions occurring in bioreactors [Text] / B. Taboada, L. V. Alvarado, M. C. Aguilar // Exp. Fluids. — 2006. — Vol. 41. —P. 383-392.

169. Verma, Y. A support vector approach for cross-modal search of images and texts [Text] / Y. Verma, C. V. Jawahar // Computer Vision and Image Understanding. — 2017. — Vol. 154. — P. 48-63.

170. Virginie, E. A wavelet characterization of high-resolution NDVI patterns for precision agriculture [Text] / E. Virginie, S. Alfred, M. Steven // JAG. — 2001. — Vol. 3. — P. 121-132.

171. VK [Electronic resource] // [https://vk.com.]. — Russian : [s. n.]. — Дата доступа: 2017.

172. Wang, L. Machine Learning for Human Motion Analysis [Text] / L. Wang, L. Chengand G. Zhao // IGI Global. — 2009. — P. 318.

173. Wang, X. X. Pavement Distress Image Automatic Classification Based on DENSITY-Based Neural Network [Text] / X. X. Wang, Y. X. Zhang // Lecture Notes in Computer Science, Springer. — 2001. — Vol. 4062. — P. 685-692.

174. Warmuth, M. K. Support Vector Machines for active learning in the drug discovery process [Text] / M. K Warmuth, J. Liao, G. Ratsch // Journal of Chemical Information Sciences. — 2003. — Vol. 43, no. 2. — P. 667-673.

175. Weinberger, K. Q. Distance metric learning for large margin nearest neighbor classification. [Text] / K. Q. Weinberger, L. K. Saul // Journal of Machine Learning Research. — 2009. — Vol. 10. — P. 207-244.

176. Witten, I. H. Practical Machine Learning Tools and Techniques (Third Edition) [Text] / I. H. Witten, E. Frank // Data Mining. — 2005. — P. 628.

177. Won, C. S. Unsupervised segmentation of noisy and textured images using Markov random fields [Text] / C. S. Won, H. Derin // Computer Graphics and Image Processing: Graphical Models and Image Processing. — 1992. — Vol. 54. — P. 208328.

178. Yandex [Electronic resource] // [https://https://yandex.ru.]. — USA : [s. n.]. — Дата доступа: 2017.

179. Yashon, O. Wavelet-morphology based detection of incipient linear cracks in asphalt pavements from RGB camera imagery and classification using circular Radon transform [Text] / O. Yashon, M. Hahn // Advanced Engineering Informatics. — 2016. — Vol. 30. — P. 481-499.

180. Younes, G. Supervised Learning and Automatic Recognition of Asphalt Pavement Deteriorations [Text] / G. Younes, C. Hadda, Z. Djellou // MASAUM Journal of Basic and Applied Sciences. — 2009. — Vol. 1, no. 2. — P. 254-259.

181. Yu, B. Estimation and uncertainty analysis of energy consumption and CO2 emission of asphalt pavement maintenance [Text] / B. Yu, S. Wang, X. Gu // Journal of Cleaner Production. — 2018. — Vol. 189. — P. 326 - 333.

182. Yujin, Z. Detection of Individual Microbubbles Using Wavelet Transform Based on a Theoretical Bubble Oscillation Model [Text] / Z. Yujin, B. LiMing S. and Wang // Springer. — 2006. — Vol. 4222. — P. 354 - 363.

183. Zabulis, X. Detection of densely dispersed spherical bubbles in digital images based on a template matching technique [Text] / X. Zabulis, M. Papara, A. Chatziargyriou [et al.] // ColloidsSurf. A Physicochem. Eng. Asp. — 2007. — Vol. 309. — P. 96-106.

184. Zhang, H. Classification Learning System Based on Multi-Objective GA and Frigid Weather Forecast [Text] / H. Zhang, J. Xu, S. Zou // Computer, Informatics, Cybernetics and Applications. — 2011. — P. 1417-1425.

185. Zhao, Y. Evaluation of hierarchical clustering algorithms for document datasets [Text] / Y. Zhao, G. Karypis // In Proceedings of the Eleventh International Conference on Information and Knowledge Management. — 2002. — P. 515-524.

186. Zhou, J. Wavelet-aided pavement distress image processing [Text] / J. Zhou, P. S. Huang, F. P. Chiang // In Optical Science and Technology, SPIE's 48th Annual Meeting. — 2003. — P. 728-739.

187. Zhou, J. Wavelet-based pavement distress detection and evaluation [Text] / J. Zhou, P. S. Huang, F. P. Chiang. — [S. l. : s. n.], 2006. — Vol. 45. — P. 2006.

188. Zhu, C. Study of remote sensing image texture analysis and classification using wavelet [Text] / C. Zhu, X. Yang // International Journal of Remote Remote Sensing. — 1998. — Vol. 19. — P. 3197-3203.

189. Zivanovic, A. Ukiland R. Adjusted Haar wavelet for application in the power systems disturbance analysis [Text] / A. Ukiland R. Zivanovic // Digital Signal Processing. — 2008. — Vol. 18. — P. 103-115.

Приложения

Приложение А

Акты о внедрении программного продукта

СПРАВКА О ВНЕДРЕНИИ

Настоящим подтверждаю, что результаты диссертационного исследования аспиранта ФГБОУ ВО ИРНИТУ Нгуен Тху Хыонг на тему: «Математические методы моделирования и классификации объектов на основе технического зрения и машинного обучения» обладают актуальностью, представляют практический интерес и разработанное соискателем профаммное обеспечение по распознаванию пузырей используются нашей лабораторией.

Заведующей лабораторией динамики парогенерируюших систем Института систем энергетики им. Л.А. Мелентьева СО РАН,

к.т.н.

А.А. Левин

Иркутск, 04.09.2018

УТВЕРЖДАЮ

f'//^.....

ц т*>/ Vi,«»«

Директор института высоких технологий ИРНИТУ

»

Е.А. Анциферов

2018 г.

АКТ

о внедрении программного продукта «Программа автоматического обнаружения и классификации дефектов дорожного покрытия»

(авторы Сидоров Д.Н., Нгуен Т.Х., Нгуен Т.Д.)

Комиссия в составе: Дорофеев A.C., к.т.н., заведующий кафедрой вычислительной техники ИРНИТУ (председатель), Кирий В.Г., профессор кафедры вычислительной техники, Хрусталёв Ю.П., доцент кафедры вычислительной техники, составила настоящий акт о том, что программный продукт «Программа автоматического обнаружения и классификации дефектов дорожного покрытия», авторами которого являются Сидоров Денис Николаевич, Нгуен Тхе Лонг, Нгуен Тху Хыонг внедрен в учебный процесс и использован на кафедре вычислительной техники в учебном курсе «Интеллектные вычислительные системы» для бакалавров профиля «Вычислительные машины, комплексы, системы и сети».

Использование созданной Сидоровым Д.Н., Нгуен Т.Х., Нгуен Т.Д. программы для ЭВМ «Программа автоматического обнаружения и классификации дефектов дорожного покрытия» (Свидетельство о государственной регистрации 2016619386 от 18 августа 2016), позволяет решить задачу автоматического обнаружения и идентификации дефектов дорожного покрытия на основе методов обработки изображений и алгоритмов машинного обучения и применяется для демонстрации возможностей машинного обучения. Программа выполняет следующие три основные этапа: предварительная обработка изображения для улучшения качества изображений; обнаружение областей дефектов и автоматическое извлечение признаков; классификация дефектов.

Программный модуль имеет простой, удобный и интуитивно понятный интерфейс. Указанный программный модуль предназначен для исследователей, аспирантов и магистрантов, научные интересы которых лежат в области обработки изображений и машинного обучения, при обучении программированию в MATLAB, а также студентам при изучении соответствующих дисциплин.

Председатель комиссии Члены комиссии

Дорофеев A.C. Кирий В.Г. Хрусталёв Ю.11

Приложение Б

Свидетельства о государственной регистрации программы для ЭВМ

Приложение В Дипломы

ш

Национальный исследо вательски й Иркутский государственный технический университет

Грамота

награждается

Ягу ей ЯТху Хыонг

аспирант-стажер ИрГТУ за участие

в выставке научных достижений институтов и факультетов ИрГТУ в рамках Дня российской науки

Проректор по на г. Иркутск

Г

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.