Алгоритмы и программный комплекс анализа многомерных данных о природных объектах с применением статистического и нечеткого моделирования тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Лучкова, Софья Викторовна
- Специальность ВАК РФ05.13.18
- Количество страниц 122
Оглавление диссертации кандидат наук Лучкова, Софья Викторовна
СОДЕРЖАНИЕ
Сокращения
Введение
Глава 1. Обзор методов моделирования и исследования многомерных данных
1.1 Особенности предмета исследования и область применения
1.2 Обзор методов восстановления пропущенных значений в многомерных данных
1.2.1 Классические методы восстановления пропущенных значений
1.2.2 Неклассические методы восстановления пропущенных значений
1.3 Численные и статистические методы анализа многомерных данных
1.4 Методы классификации многомерных данных
1.5 Пространственный анализ данных с применением геоинформационных систем
1.6 Программно-инструментальные средства анализа многомерных данных
1.7 Постановка задач диссертационных исследований
Глава 2. Разработка методики комплексного анализа многомерных данных
2.1 Схема проведения комплексного анализа многомерных данных
2.2 Алгоритмическое обеспечение
2.2.1 Алгоритмы нечеткого моделирования
2.2.2 Алгоритм восстановления данных
2.2.3 Алгоритм факторного анализа с вращением
2.2.4 Алгоритм классификации многомерных данных
2.3 Методические вопросы пространственного анализа данных с применением ГИС
Выводы по главе 2
Глава 3. Программная реализация разработанной методики
3.1 Выбор средства реализации
3.2 Архитектура программного комплекса
3.3 Визуальная часть программного комплекса
3.3.1 Блок "Моделирование"
3.3.2 Блок "Восстановление данных"
3.3.3 Блок "Анализ данных"
Выводы по главе 3
Глава 4. Практическое применение результатов диссертационного исследования
4.1 Исследование адекватности результатов моделирования
4.2 Анализ точности алгоритмов восстановления пропущенных значений
4.3 Комплексный анализ многомерных данных о микробиологических и физико-
химических свойствах нефти
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
Сокращения
АМК - алгоритм муравьиной колонии ГА — генетический алгоритм ГИС - геоинформационная система ЛП - лингвистическая переменная МГК - метод главных компонент МНК - метод наименьших квадратов НГП - нефтегазовая провинция НС - нечеткая система ПК - программный комплекс САО - средняя абсолютная ошибка СКО - среднеквадратичная ошибка ФА - факторный анализ ФП - функция принадлежности ЭС — эволюционная стратегия
"Каждый день мы используем числа, чтобы прогнозировать погоду, определять время, считать деньги
закономерности, предсказывать поведение
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Алгоритмы комплексного анализа многомерных данных о природных объектах с применением метода главных компонент и геоинформационных систем2003 год, кандидат технических наук Перемитина, Татьяна Олеговна
Алгоритмы и программные средства идентификации нечетких систем на основе метода роящихся частиц2013 год, кандидат наук Синьков, Дмитрий Сергеевич
Идентификация состояний многомерных объектов на основе адаптивных моделей нечеткого логического вывода2004 год, кандидат технических наук Матасов, Андрей Сергеевич
Решение задач восстановления пропущенных значений признаков и многоклассовой классификации2018 год, кандидат наук Рязанов, Василий Владимирович
Разработка и исследование методов эффективного использования технологической информации для управления качеством продукции в металлургии2009 год, кандидат технических наук Журавлева, Марина Гарриевна
Введение диссертации (часть автореферата) на тему «Алгоритмы и программный комплекс анализа многомерных данных о природных объектах с применением статистического и нечеткого моделирования»
ВВЕДЕНИЕ
Актуальность работы
Научно-исследовательская деятельность сопряжена с обработкой постоянно увеличивающегося массива разрозненной совокупной информации об объектах исследования. Аналитические процессы предполагают обработку огромного количества материалов и включают такие трудоемкие процессы как систематизация, выявление каких-либо закономерностей, преобразование данных для последующего математического моделирования. Модели данных - это важнейшая составляющая для анализа, так как то, насколько полно и детально модель может представить предметную область и ее явления, в значительной степени определяет функциональные возможности создаваемой системы. Однако построение модели и последующего анализа осложняется проблемой неточного или неполного описания изучаемых объектов. Одним из подходов к решению данной проблемы является применение методов статистического и нечеткого моделирования.
Нечеткое моделирование используется при построении сложных моделей, когда трудно сформировать аналитическую модель объекта: когда аналитическая модель слишком сложна, когда имеется неполнота экспертных данных для статистического моделирования и т.д. Нечеткие системы применяются в таких проблемных областях науки и техники как прогнозирование, распознавание образов, автоматическое управление, системы принятия решений, робототехника. Преимуществами НС является невысокая стоимость разработки, гибкость, интуитивно понятная логика функционирования.
Важным моментом, решаемым в процессе построения НС, является идентификация ее параметров. Актуальной задачей является повышение точности вывода НС на реальных данных. Для настройки параметров НС используются различные методы оптимизации, наряду с методами, основанными на производных, применяются генетические алгоритмы, эволюционные стратегии и нейронные сети. Эволюционные стратегии (ЭС) совместно с эволюционным программированием и генетический алгоритм представляют три главных направления развития эволюционного моделирования. Несмотря на то, что каждый из методов
возник независимо от других, они характеризуются рядом общих свойств. Для любого из них формируется исходная популяция, которая подвергается селекции и воздействию различных генетических операторов, что позволяет находить лучшие решения. Построение алгоритмов на основе метода эволюционной стратегии основываются на трудах Ingo Rechenberg, Hans-Paul Schwefel, H.-G. Beyer, J, Klockgether, S. Kern, A. Auger, Д. Рутковской, S.L. Luke, N. Hansen, А. Ostermeir а алгоритмы нечеткого моделирования на работах А.Н. Аверкина, И.А. Ходашинского, И.З. Батыршина, JI.C. Берштейна, Л.Г. Комарцовой, A.B. Язенина, Н.Г., Ярушкиной, Р.Н. Ishibuchi,n, R.R. Yager, T.Yasukawa, L.-X. Wang, L. Zadeh, H. Bahrami, M. Abdechiri, M.R. Meybodi, Y. Zhang, X. Wu, Z. Xing, W. Hu.
Ввиду многомерности изучаемых данных для проведения анализа появляется потребность в их более компактном описании, то есть в сжатии информации до более важных характеристик. Факторный анализ (ФА) позволяет учитывать эффект существенной многомерности данных и дает возможность более простого, лаконичного объяснения многомерной структуры. Сжатие информации получается за счет того, что число факторов значительно меньше, чем было исходных параметров. Отсюда основными целями ФА является понижение числа используемых переменных и наглядная визуализация полученных данных.
При исследовании природных объектов, таких как нефть, для повышения наглядности результатов и помощи в их интерпретации требуют включения в анализ пространственных свойств объектов исследования — географические координаты, глубина залегания и др. Для учета и анализа пространственных данных применяются геоинформационные системы (ГИС), позволяющие визуализировать большие объемы информации с пространственными свойствами, включая связанную с ними количественную информацию об объектах.
Выявленные особенности широкого класса природных объектов требуют комплексного подхода к анализу. Комплексность понимается как возможность проведения исследований многомерных неполных данных на основе сочетания методов нечеткого моделирования и многомерного статистического анализа с целью восстановления пропущенных значений, проведения анализа структуры данных, выявления скрытых взаимосвязей между свойствами, а также исследования пространственных свойств объектов, отображая результаты анализа средствами ГИС в едином комплексе программ.
В настоящее время методические вопросы комплексного анализа многомерных данных, решающие одновременно вопросы восстановления неполных данных, редукции исходных данных, выявление значимых свойств объектов исследования, а так же визуализации с географической привязкой, разработаны недостаточно. В связи с этим возникла потребность разработки новой методики, основанной на сочетании методов нечеткого и статистического моделирования.
Объект исследования - природные пространственно-распределенные объекты, например нефти, для описания свойств которых используются многомерные массивы данных.
Предмет исследования — комплекс алгоритмов и программ определения зависимостей между различными свойствами природных объектов (например, между физическими, химическими и пространственными свойствами).
Цель работы - разработка алгоритмов и комплекса программ анализа многомерных данных о различных свойствах природных объектов, основанных на сочетании методов нечеткого моделирования, многомерного статистического анализа и методов пространственного анализа с применением геоинформационных систем.
Задачи исследования:
1. Анализ предметной области и обзор существующих решений в области комплексного анализа многомерных неполных данных.
2. Разработка методики проведения комплексного анализа многомерных неполных данных с применением нечеткого и статистического моделирования.
3. Разработка алгоритмов комплексного анализа многомерных неполных данных.
4. Проведение исследований разработанных алгоритмов на типовых контрольных примерах и тестовых выборках.
5. Проектирование и разработка программного комплекса.
6. Применение и внедрение программного комплекса анализа многомерных неполных данных.
Методы исследований: методы нечеткого моделирования, нечетких множеств, математической статистики, линейной алгебры, метод факторного анализа, численные методы, метод кластеризации, методы пространственного анализа средствами ГИС, методы объектно-ориентированного программирования.
Достоверность результатов обеспечивается строгостью применения математических методов, результатами проведенных численных экспериментов, которые сопоставлены с данными, полученными другими авторами.
Научная новизна. В диссертационной работе получены следующие новые научные результаты:
1. Предложена методика проведения комплексного анализа многомерных данных о природных пространственно-распределенных объектах, обеспечивающая выявление новых закономерностей между свойствами исследуемых объектов.
2. Модифицированный алгоритм идентификации нечеткой системы с заданной структурой, включающий генерацию структуры НС с заданными параметрами функции
принадлежности и оптимизацию параметров НС, основанную на методе эволюционной стратегии и методе наименьших квадратов.
3. Впервые разработан алгоритм восстановления пропущенных значений, основанный на разработанном модифицированном алгоритме идентификации нечеткой системы, отличающийся от известных алгоритмов и статистических методов снятием требований к знанию закона распределения.
Практическая ценность.
Созданный программный комплекс внедрен в ИХН СО РАН и применялся при выполнении Бюджетного проекта У.39.3Л. Исследование физико-химических свойств гетерогенных нефтесодержащих систем и их структурной организации на микро- и наноуровне с целью развития научных основ экологически безопасных технологий извлечения вязких парафинистых нефтей по теме «Разработка методических вопросов восстановления пропущенных значений в выборочном массиве из базы данных по свойствам вязких парафинистых нефтей с использованием методов вероятностного моделирования и кластерного анализа данных» и проекта РФФИ 11-05-98023 «Исследование влияния химического состава и условий залегания нефтей на численность, распространение и активность пластовой микрофлоры для повышения нефтеотдачи».
Разработанный программный комплекс внедрен в Федеральном государственном бюджетном учреждении науки Институте мониторинга климатических и экологических систем Сибирского отделения Российской академии наук (ИМКЭС СО РАН) и используется в рамках выполнения работ по программе интеграционного проекта № 70 Сибирского отделения РАН «Анализ и прогноз проявлений вынуждающего воздействия в ритмике метеорологических полей Северного полушария Земли» для анализа разнородной междисциплинарной информации о состоянии и изменениях климатообразующих параметров исследуемых территорий.
Разработанные алгоритмы и программный комплекс используются при выполнении научно-исследовательских работ (задание № 2014/225) в рамках базовой части государственного задания Минобрнауки России для проведения комплексного анализа многомерных характеристик, описывающих процесс принятия решений в производственно-экономических и социальных системах, для решения задач определения границ объектов территориального устройства на основе многомерных данных об инфраструктурной среде и социально-экономических характеристиках в условиях нормативных ограничений.
Алгоритмы блока «Анализ данных» программного комплекса используются в учебном процессе при проведении лабораторных работ по дисциплине «Качество программных систем»
на кафедре АОИ ТУСУР, являясь инструментом анализа показателей качества программных систем.
Апробация работы. Основные положения работы докладывались на научных конференциях различного уровня. На VII и VIII международных конференциях "Химии нефти и газа" г. Томск, 2009, 2012 г.; на VII всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии», г. Томск, 2009 г.; на IV Всероссийской конференции молодых ученых «Материаловедение, технологии и экология в 3-м тысячелетии», г. Томск, 2009 г.; на IX всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии», г. Томск, 2011 г.; на XVIII Международной научно-практической конференции студентов, аспирантов и молодых ученых "Современные техника и технологии", г. Томск, 2012 г.; на III Всероссийской молодежной научной конференции «Современные проблемы математики и механики», г. Томск, 2012 г.; на Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых «Научная сессия ТУСУР», г. Томск, 2010,2011,2012 г, так же опубликованы работы в сборнике «Доклады ТУСУР» (г. Томск, 2013 г.), в журнале «Информационные технологии» (г. Москва, 2013-2014 г.).
Защищаемые положения:
1. Методика проведения комплексного анализа многомерных данных о природных пространственно-распределенных объектах, обеспечивающая выявление новых закономерностей между свойствами исследуемых объектов.
Соответствуют пункту 5 паспорта специальности: Комплексные исследования научных и технических проблем с применением современной технологии математического моделирования и вычислительного эксперимента.
2. Модифицированный алгоритм идентификации нечеткой системы с заданной структурой, включающий генерацию структуры НС с заданными параметрами функции принадлежности и оптимизацию параметров НС, основанную на методе эволюционной стратегии и методе наименьших квадратов. Модель позволяет детально учитывать структуру входных данных объекта моделирования, снимая требования к знанию закона распределения.
3. Алгоритм восстановления пропущенных значений на основе модифицированного алгоритма идентификации НС с заданной структурой позволяет увеличить точность восстановления пропущенных значений по сравнению с алгоритмами, предлагаемыми другими авторами как минимум в 1,5 раза на тестовых данных.
Соответствуют пункту 1 и 3 паспорта специальности: 1)Разработка новых математических методов моделирования объектов и явлений. 3)Разработка, обоснование и
тестирование эффективных вычислительных методов с применением современных компьютерных технологий.
4. Программный комплекс анализа многомерных неполных данных о природных объектах, позволяющий выявлять существующие закономерности между различными свойствами исследуемых объектов.
Соответствует пункту 4 паспорта специальности: Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента.
Публикации по теме работы. Основные положения диссертации отражены в 19 опубликованных работах. В том числе 5 статей напечатаны в ведущих рецензируемых научных журналах и изданиях РФ, в которых ВАК рекомендует публикацию основных результатов диссертационных работ, и получено 1 свидетельство об официальной регистрации программы для ЭВМ (Свидетельство: № 2013619931 от 21.10.2013 г.).
Личный вклад автора. Постановка задачи, а также подготовка материалов к печати велась совместно с научным руководителем. Все основные результаты диссертации получены лично автором. Автор самостоятельно разработал программный комплекс для комплексного анализа многомерных неполных данных.
Структура и объем работы. Диссертация состоит из введения, основной части, включающей в себя четыре главы, заключения, списка используемой литературы из 113 источников, 5 приложений. Объем диссертационной работы составляет 122 страницы. Работа иллюстрируется 33 рисунками и 24 таблицами.
В первой главе диссертации приведен обзор проблемы исследования. Описываются основные понятия и методы статистического анализа многомерных данных с пропусками, их классификация и модели. Приведены основные понятия и методы нечеткого моделирования многомерных данных с пропусками, методы анализа многомерных данных и методы классификации данных. Рассмотрен пространственный анализ данных с применением ГИС и приведен обзор существующих программных систем статистического и нечеткого моделирования. Проанализированы особенности основных задач, решаемых в диссертационной работе.
Во второй главе диссертационной работы приводятся алгоритмы инициализации антецедентов правил нечеткой системы (равномерная, случайная), алгоритмы инициализации консеквентов правил на основе алгоритмов: метода наименьших квадратов, метода ближайшего соседа из таблицы наблюдений. Представлены алгоритмы параметрической идентификации нечеткой системы на основе алгоритмов эволюционной стратегии, алгоритмы восстановления данных с использованием нечетких систем: алгоритм восстановления пропущенных значений в
многомерных данных и алгоритм "тестового" восстановления с использованием метода скользящего экзамена. Также приводятся алгоритм факторного анализа с вращением, алгоритм классификации данных и алгоритм передачи данных в геоинформационную систему для картографического отображения.
В третьей главе рассматриваются вопросы проектирования и реализации программного комплекса анализа многомерных данных на основе статистического и нечеткого моделирования, включающего модули идентификации нечетких систем на основе эволюционных стратегий, восстановления данных, факторного анализа с вращением, классификации данных и экспорта данных в геоинформационную систему.
В четвертой главе диссертационной работы представлены примеры практического применения разработанного подхода для проведения комплексного анализа многомерных данных с пропущенными значениями. Даются рекомендации по использованию параметров разработанных алгоритмов для моделирования системы.
В заключении формируются основные результаты диссертационного исследования.
В приложении приведены документы, подтверждающие практическое применение диссертационных результатов.
ГЛАВА 1. ОБЗОР МЕТОДОВ МОДЕЛИРОВАНИЯ И ИССЛЕДОВАНИЯ МНОГОМЕРНЫХ ДАННЫХ
\Л Особенности предмета исследования и область применения
Многие исследования связаны со сбором и обработкой многомерных данных, представленных в виде различных баз данных или таблиц наблюдений типа "объект-свойство". Данные из этих таблиц участвуют при решении широкого круга задач анализа: классификации, прогнозирования, выявления различных закономерностей. Однако, в большинстве случаев, задачи проведения анализа осложняются: 1) проблемой неточного или неполного описания изучаемого объекта; 2) большим объемом данных, сформированных по самым различным свойствам; 3) наличием географической привязки, когда объекты исследования относятся к числу пространственных.
Для детального изучения явления или объекта необходимо включать в анализ как можно большее число характеристик, всесторонне описывающих объект анализа. Существует широкий класс природных объектов, представленных многомерными массивами данных, для анализа которых необходимо учитывать их пространственные характеристики. Пространственными принято считать те объекты, для анализа которых важен учет их расположения, географическая форма (точка, линия, полигон) и их взаиморасположение с другими пространственными объектами.
Таким образом, можно сформулировать наиболее характерные особенности объектов исследования:
1. Многомерность данных.
2. Пропущенные значения в данных.
3. Разнородность данных.
4. Наличие пространственных свойств.
5. Статистический характер информации об объектах.
Объекты исследования, обладающие перечисленными свойствами, встречаются довольно часто при проведении исследований. Практически всем исследователям на определенном этапе работы приходится анализировать и интерпретировать многомерные массивы экспериментальных данных об объектах или явлениях. Таким образом, необходимо проводить комплексный анализ, включающий различные статистические методы обработки многомерных данных об объекте и методы пространственного анализа объектов исследования.
Большой объем данных и разрозненность свойств делают объекты не наглядными, вследствие чего применение одного метода для корректного анализа становится недостаточным. Для решения проблемы неточного или неполного описания объекта нужно
применить один метод, для сжатия информации - второй, для выявления важных свойств -третий, для пространственных свойств - четвертый и т.д. Отсюда возникает потребность в комплексном подходе к анализу данных, который позволит адекватно проанализировать, выявить закономерности, смоделировать системы и получить целостную картинку изучаемого объекта с учетом всех его особенностей.
Комплексный анализ может включать в себя несколько условных этапов:
1. Первый этап решает проблему неточного или неполного описания изучаемого объекта. Традиционные причины, которые приводят к появлению пропусков, можно разделить на два типа. Первый тип - это объективные причины, то есть поломка оборудования при измерении тех или иных характеристик, потеря ретроспективной информации, ограничение доступа к информации и другое. И второй тип - субъективные причины, которые обусловлены человеческим фактором при накоплении информации. В результате, для обработки или анализа собранных данных имеются неполные сведения [1]. Поэтому первый этап - восстановление данных - является необходимым условием построения каких-либо моделей, как этап предварительной подготовки данных перед проведением анализа.
2. Второй этап - вычислительный. Данный этап включает все необходимые расчеты и является основным этапом анализа. Например, факторный анализ - включает в себя расчет корреляционной матрицы, которая позволяет выявить корреляционную связь между свойствами, включает расчет собственных чисел и векторов, по которым определяются значимые факторы, и производится сжатие информации.
3. Третий этап - применение дополнительных методов, например, методов классификации для наглядного отображения данных.
4. Четвертый этап - рассмотрение полученных численных результатов, графического отображения, экспорт результатов, например, для отображения результатов на карте.
В качестве примера применения такого комплексного подхода рассмотрим задачу анализа данных о физико-химических свойствах вязких парафинистых нефтей. Для анализа выбрано 148 образцов нефти, из созданной в Институте химии нефти СО РАН базы данных [2], включающей описание более 20 тыс. образцов.
Каждая запись содержит 25 характеристик о составе и свойствах нефти, технологических и физико-химических данных о нефти. Предварительный анализ показал, что из 3700 значений пропущено 1864 (50%), такой показатель требует исключения некоторых характеристик из дальнейшего исследования. После исключения характеристик была создана новая выборка, состоящая из 148 образцов нефти по 8 характеристикам (Табл. 1.1).
Таблица 1.1 - Информация о пропущенных значениях в исследуемой выборке
№ Характеристики нефти Кол-во пропусков Пропущено значений из 148 (%)
1 плотность, г/см 1 0.67
2 вязкость при 20 ° С, мм2/с 0 0
3 температура застывания, ° С 44 30
4 содержание общей серы, масс. % 18 12
5 содержание твердого парафина, масс. % 0 0
6 содержание силикагелевых смол, масс. % 14 9
7 содержание асфальтенов, масс. % 11 7
8 содержание асфальто-смолистых веществ, масс. % 18 12
Однако данный объём выборки по-прежнему не позволяет получать обоснованные результаты статистического анализа, поэтому предварительно необходимо расширить объём выборки за счет использования метода восстановления данных. После восстановления пропущенных значений в изучаемой выборке, можно будет провести статистический анализ для выявления особенностей структуры данных и некоторых характеристик, которые помогут выбрать методы добычи вязких парафинистых нефтей.
Перейдем к рассмотрению и сравнению методов, которые позволяют сделать комплексный анализ с учетом всех свойств изучаемого объекта.
1.2 Обзор методов восстановления пропущенных значений в многомерных данных
В данном разделе рассмотрим методы восстановления пропущенных значений, которые можно разделить условно на классические методы (известные из теории вероятности и статистики с 70-х годов 20 века) и неклассические методы, которые пришли из машинного обучения, кластерного анализа, нейронных сетей и нечетких систем в более позднее время.
1.2.1 Классические методы восстановления пропущенных значений
В начале 70-х годов начался расцвет исследований по статистическому анализу данных с пропусками, последовавший за успехами в развитии компьютерной техники, которая сделала доступными вычисления, которые были очень трудоемкими для расчета ранее.
Среди работ по анализу данных с пропусками выделяют:
- Aflfi A.A. и Elashoff R.M. (1966) - Неполные данные в многомерной статистике;
- Хартлей Х.О. и Хоккинг Р.Р. (1971) - Анализ неполный данных;
-Орчард Т. и Вудбери М. (1972) - Принцип неполной информации: теория и приложение;
- Демптер А.П., Лаирд Н.М., Рубин Д.Б. (1977) - Метод максимального правдоподобия на неполных данных с помощью ЕМ-алгоритма;
- Литтл Р.Дж. А, Рубин Д.Б. (1982) - Статистический анализ данных с пропусками.
Рассмотрим алгоритмы импутирования (заполнения пропусков в данных) по группам [3]:
1. Простые алгоритмы — неитеративные алгоритмы, основанные на простых арифметических операциях, расстояниях между объектами, регрессионном моделировании. К ним относятся заполнение пропусков средним арифметическим, регрессионное моделирование пропусков, метод ближайших соседей и метод подбора в группе.
2. Сложные алгоритмы — итеративные алгоритмы, предполагающие оптимизацию некоторого функционала, отражающего точность расчета подставляемых на место пропуска значений. Их можно разделить на глобальные и локальные методы.
2.1 Глобальные алгоритмы — алгоритмы, предусматривающие, что в оценивании (предсказании) каждого пропущенного значения участвуют все объекты рассматриваемой совокупности: метод Бартлетта, ЕМ - оценивание и метод главных компонент (МГК).
2.2. Локальные алгоритмы — алгоритмы, в которых для оценивания (предсказания) каждого пропущенного значения участвуют полные наблюдения, находящиеся в некоторой окрестности предсказываемого объекта. К данной группе относятся алгоритмы множественного импутирования, и 1&Вга1с1.
Кратко рассмотрим методы импутирования входящие в состав перечисленных групп (в порядке исследования).
Метод (безусловного) среднего, предполагает, что все пропущенные значения заменяются средним значением данного признака. Самый простой, но не самый точный метод заполнения пропусков в данных [3,4].
Регрессионные модели. Термин "регрессия" [5] был введен Ф. Гальтоном в конце 19 века. Гальтон обнаружил, что дети родителей с высоким/низким ростом обычно не наследуют выдающийся рост и назвал этот феномен "регрессия к посредственности". Сначала этот термин использовался исключительно в биологическом смысле. После работ К. Пирсона этот термин стали использовать и в статистике. В статистической литературе различают регрессию с участием одной свободной переменной и с несколькими свободными переменными — одномерную и многомерную регрессию. Также различают линейную и нелинейную регрессию. Если регрессионная модель не является линейной комбинацией функций от параметров, то говорят о нелинейной регрессии. При этом модель может быть произвольной суперпозицией
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Разработка интеллектуальных систем моделирования слабоформализуемых процессов на основе нейро-нечетких моделей2022 год, кандидат наук Буй Чыонг Ан
Алгоритмы и программные средства идентификации парето-оптимальных нечетких систем на основе метаэвристических методов2014 год, кандидат наук Горбунов, Иван Викторович
Нечеткие нейросетевые модели с динамической структурой в интеллектуальных системах анализа данных на многомерных шкалах2011 год, кандидат технических наук Красковский, Антон Борисович
Гибридные алгоритмы муравьиной колонии для идентификации параметров нечетких систем2011 год, кандидат технических наук Дудин, Павел Анатольевич
Системы измерения многомерных перемещений элементов конструкций газотурбинных двигателей с верификацией полученных результатов2001 год, кандидат технических наук Боровик, Сергей Юрьевич
Список литературы диссертационного исследования кандидат наук Лучкова, Софья Викторовна, 2014 год
СПИСОК ЛИТЕРАТУРЫ
1. Лучкова С.В. Применение программного комплекса "Нечеткая система на основе эволюционной стратегии" для задачи импутирования / Т.О. Перемитина, С.В. Лучкова // Информационные технологии, - 2013. - № 2. - С. 47-50.
2. База данных "химия нефти и газа" [Электронный ресурс]. Режим доступа: http://enrit.ipc.tsc.ru/basel.htm, свободный (дата посещения 15.08.2013).
3. Литтл Р.Дж.А. Статистический анализ данных с пропусками / Р. Дж.А. Литтл, Д.Б. Рубин. - Москва, "Финансы и статистика", 1991. - 336 с.
4. Среднее значение [Электронный ресурс]. Режим доступа: http://en.wikipedia.org/wiki/Mean, свободный (дата обращения 24.01.2012).
5. Регрессия [Электронный ресурс]. Режим доступа: http://en.wikipedia.org/wiki/Regression_toward_the_mean, свободный (дата обращения 24.01.2012).
6. Корреляция [Электронный ресурс]. Режим доступа: http://en.wikipedia.org/wiki/Correlation_and_dependence, свободный (дата обращения 25.01.2012).
7. Холюшкин Ю.П. К методике восстановления данных при анализе технологических индексов мустьерских комплексов Средней Азии / Ю.П. Холюшкин, Г.Ю. Жилицкая // [Электронный ресурс]. Режим доступа: http://www.sati.archaeology.nsc.ru/Home/pub/Data/?html=hol9.htm&id=l 75 (дата обращения 20.02.2012).
8. Эфрон Б. Нетрадиционные метода многомерного статистического анализа. -Москва, "Финансы и статистика", 1988.-263 с.
9. Hastie Т. Principal Curves / Т. Hastie, Stuetzle W. - Journal of the American Statistical Association, 1989.-P. 502-516.
10. Friedman J.H. Multivariate adaptive regression splines. - The Annais of Statistics, 1990. - Vol. 19.-№ l.-P. 1-141.
11. Целых B.P. Многомерные адаптивные регрессионные сплайны // Машинное обучение и анализ данных. - 2012. - Т1. № 3. - С. 272-278.
12. Рыскулов С.Н. Разработка и исследование новых версий zet заполнения пробелов в эмпирических таблицах. [Электронный ресурс]. Режим доступа: http://www.zetbraid.narod.ru/, свободный (дата обращения 15.12.2011).
13. Лучкова С.О. Применение нечеткой системы на основе эволюционной стратегии для восстановления пропусков в данных // Материалы докладов Всероссийской научно-
технической конференции студентов, аспирантов и молодых ученых "Научная сессия ТУСУР-2011".-Томск: "В-Спектр", 2011. - 4.2. - С. 184-186.
14. Россиев А.А, Итерационное моделирование неполных дынных с помощью многообразий малой размерности [Электронный ресурс]. Режим доступа: http://pca.narod.ru/DisRos.htm, свободный (дата обращения 09.10.2011).
15. Trion R.G. Cluster analysis. - London: Ann Arbor Edwards Bros, 1939. - 139 p.
16. Рязанов В. Кластеризация неполных данных [Электронный ресурс]. Режим доступа: http://www.foibg.com/ibs_isc/ibs-22/ibs-22-p02.pdf, свободный (дата обращения 24.12.2011).
17. Дюран В. Кластерный анализ / В. Дюран, П. Оделл. - М.: Статистика, 1977. - 128
с.
18. Райзен Д. В. Классификация и кластер. - М.: Мир, 1980.
19. Снитюк В.Е. Эволюционный метод восстановления пропусков в данных // Сборник трудов VI-й Межд. конференции "Интеллектуальный анализ информации". - Киев, 2006.-С. 262-271.
20. Заде JI. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976. — 146 с.
21. Hoche S. A Comparative Evaluation of Feature Set Evolution Strategies for Multirelational Boosting / S. Hoche, S. Wrobel. - Proc. 13th Int. Conf. on ILP. - P. 180-196.
22. Ходашинский И.А. Основанные на производных и метаэвристические методы идентификации параметров нечетких моделей / И.А. Ходашинский, В.Ю. Гнездилова, П.А. Дудин, А.В. Лавыгина // Труды VIII международной конференции "Идентификация систем и задачи управления" SICPRO '08. - Москва, 2009 г. - С. 501-529.
23. Рутковская Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рутковская, М. Пилиньский, Л. Рутковский. — М.: Горячая линия. 2006. — 383 с.
24. Sean Luke. Essentials of Metaheuristics. - Lulu, 2009. - 235 c.
25. Bahrami H. Imperialist competitive algorithm adaptive colonies movement / H. Bahrami, M. Abdechiri, M.R. Meybodi // I.J. Intelligent system and applications. — 2012. — № 2. -P.49-57.
26. Загоруйко H. Г. Методы распознавания и их применение. — М.: "Сов.радио", 1972. -216с.
27. Лучкова С.О. Идентификация нечеткой системы методом эволюционной стратегии // Материалы сб. трудов Всероссийского конкурса научно-исследовательских работ
студентов и аспирантов в области информатики и информационных технологий в рамках Всероссийского фестиваля науки. - Белгород, 2011. - С. 92-101.
28. Арене X. Многомерный дисперсионный анализ / X. Арене, Ю. Лейтер. - М.: Финансы и статистика, 1985. - 230 с.
29. Шеффе Г. Дисперсионный анализ. - М.: Физматгиз, 1963.
30. Фёрстер Э. Методы корреляционного и регрессионного анализа / Э.Ферстер, Б. Ренц. - М.: Финансы и статистика, 1983. — 302 с.
31. Дрейпер Н. Прикладной регрессионный анализ /Н. Дрейпер, Г. Смит. - М.: Статистика, 1973. - 392 с.
32. Демиденко Е. 3. Линейная и нелинейная регрессии. — М.: Финансы и статистика, 1981.-302 с.
33. Себер Дж. Линейный регрессионный анализ. - М.: Мир, 1980.
34. Езекиэл М. Методы анализа корреляций и регрессий / М. Езекиэл, К.А. Фокс. -М.: Статистика, 1966. - 559 с.
35. Ковариационный анализ [Электронный ресурс]. — Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=K0BapHa4H0HHbift_aHariH3, свободный (дата обращения 15.05.2013).
36. Андрукович П.Ф. Применение метода главных компонент в практических исследованиях. - М.: Изд-во МГУ, 1973 - вып. 36. - 124 с.
37. Метод главных компонент [Электронный ресурс]. - Режим доступа: http://psyfactor.org/lib/dyuk2.htm, свободный (дата обращения 15.05.2013).
38. Ступнева А. В. Метод главных компонент в решении задач дендроклиматологии // Временные и пространственные изменения климата и годичные кольца деревьев. - Институт ботаники АН Лит. ССР, Каунас, 1984. - С. 49 -53.
39. Белонин М.Д. Факторный анализ в геологии / М.Д. Белонин, В.А. Голубева, Г.Т. Скублов. - М.: Недра, 1982 . - 269 с.
40. Уилкинсон Дж. Алгебраическая проблема собственных значений. - М.: Наука, 1970.-564 с.
41. Гусев А. Н. Измерение в психологии: общий психологический практикум / А.Н. Гусев, Ч.А. Измайлов, М.Б. Михалевская. - 2-е изд. М.: Смысл, 1998. - 286 с.
42. Дэвис Д. Статистика и анализ геологических данных. - М.: Мир, 1977. - 571 с.
43. Андерсон Т. Введение в многомерный статистический анализ. — М.: Физматгиз, 1963.-500 с.
44. Йёреског К.Г. Геологический факторный анализ / К.Г. Йереског, Д.И. Клован, P.A. Реймент // Л.: Недра, 1980. - 220 с.
45. Айвазян С.А. Классификация многомерных наблюдений / С.А. Айвазян, И.З. Бежаева, О.В. Староверов. - М.: Статистика, 1975. - 238 с.
46. Методы классификации [Электронный ресурс]. — Режим доступа: http://www.aiportal.ru/articles/autoclassification/methods-class.html, свободный (дата обращения 03.06.2013).
47. Воронцов К.В. Алгоритмы кластеризации и многомерного шкалирования. Курс лекций. МГУ, 2007. [Электронный ресурс]. — Режим доступа: http://www.ccas.ru/voron/download/Clustering.pdf, свободный (дата обращения 11.08.2010)
48. K-means clustering [Электронный ресурс]. — Режим доступа: http://en.wikipedia.org/wiki/K-means_clustering, свободный (дата обращения 06.05.2012).
49. Гусев В.А. Алгоритм построения иерархической дендограммы кластер-анализом в геолого-геохимических приложениях / В.А. Гусев, И.К. Карпов, А.И. Киселев // Известия АН СССР, серия геологическая, - 1974. - №8. - С. 61-67.
50. Пасхина М.В. Пространственный анализ в ГИС-системах: сущность, направления, возможности (Часть I) // Ярославский педагогический вестник, 2011. — № 1. - Том III (Естественные науки). - С. 156-163.
51. Кошкарев A.B. Теоретические и методические аспекты развития географических информационных систем / A.B. Кошкарев, B.C. Тикунов, A.M. Трофимов // География и природные ресурсы, 1991. —№1. —С. 11-16.
52. Тикунов B.C. Географические информационные системы: сущность, структура, перспективы. - В кн.: Картография и геоинформатика. Итоги науки и техники, сер. Картография. - М.: ВИНИТИ АН СССР, 1991.- т. 14. - С. 6-79.
53. Arc View GIS. - Envorinmental Systems Research Institute. Inc. N.Y., 1997. - 376 p.
54. Коновалова H. В. Введение в ГИС / H.B. Коновалова, Е.Г. Карпалов. — Москва, 1997.-160 с.
55. Методы и средства интеллектуального анализа данных [Электронный ресурс]. -Режим доступа: http://itteach.ru/predstavlenie-znaniy/metodi-i-sredstva-intellektual-nogo-analiza-dannich, свободный (дата обращения 15.04.2011).
56. Джонс М.Т. Программирование искусственного интеллекта в приложениях. -ДМК Пресс, 2004.-312с.
57. Краткий обзор некоторых статистических пакетов [Электронный ресурс]. - Режим доступа: http://www.quality-life.ru/metodologiya01.php, свободный (дата обращения 15.04.2011).
58. Леоненков A.B. Нечеткое моделирование MATLAB и fuzzy TECH. - СПб.: БХВ-Петербург, 2003. - 736 с.
59. Самарский A.A. Математическое моделирование: Идеи. Методы. Примеры / A.A. Самарский, А.П. Михайлов. - М.: ФИЗМАТЛИТ, 2002. - 320 с.
60. Официальная страница Matlab (EN). [Электронный ресурс]. - Режим доступа: http://www.mathworks.com/, свободный (дата обращения 26.02.2014).
61. Программный продукт Matlab. [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/MATLAB, свободный (дата обращения 26.02.2014).
62. Официальная страница Mathcad (EN). [Электронный ресурс]. - Режим доступа: http://www.ptc.com/product/mathcad/, свободный (дата обращения 26.02.2014).
63. Программный продукт Mathcad. [Электронный ресурс]. — Режим доступа: http://en.wikipedia.org/wiki/Mathcad, свободный (дата обращения 26.02.2014).
64. Официальная страница Maple (EN). [Электронный ресурс]. - Режим доступа: http://www.maplesoiit.com/products/maple/, свободный (дата обращения 26.02.2014).
65. Программный продукт Maple. [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/Maple_(software), свободный (дата обращения 26.02.2014).
66. Официальная страница Mathematica. [Электронный ресурс]. - Режим доступа: http://www.wolfram.com/mathematica/, свободный (дата обращения 26.02.2014).
67. Программный продукт Mathematica. [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/Mathematica, свободный (дата обращения 26.02.2014).
68. Официальная страница Origin (EN). [Электронный ресурс]. - Режим доступа: http://www.originlab.com/, свободный (дата обращения 26.02.2014).
69. Программный продукт Origin. [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/Origin_(software), свободный (дата обращения 26.02.2014).
70. Математическое моделирование [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/Mathematical_model, свободный (дата обращения 12.05.2013).
71. Tron Е. Mathematical modeling of observed natural behavior: a fuzzy logic approach / E. Tron, M. Margaliot // Fuzzy Sets and Systems. - 2004. - P. 437-450.
72. Штовба С.Д. Введение в теорию нечетких множеств и нечеткую логику: Нечеткая кластеризация [Электронный ресурс]. — Режим доступа: http://matlab.exponenta.ru/, свободный (дата обращения 10.04.2010).
73. Kosko В. Fuzzy systems as universal approximators. - IEEE Trans. Comput. - 1994. -
p. 43.
74. Espinosa J. Fuzzy logic, identification and predictive control / J. Espinosa, J. Vandewalle, V. Wertz. - London: Springer-Verlag, 2005. - 263 p.
75. Ходашинский И. А. Биоинсиирированные методы параметрической идентификации нечетких моделей / И.А. Ходашинский, П.А. Дудин, A.B. Лавыгина // Доклады ТУ СУР. - 2007. - С. 81-92.
76. Ходашинский И.А. Технология идентификации нечетких моделей типа синглтон и Мамдани // Труды VII международной конференции "Идентификация систем и задачи управления" SICPRO '08. Москва, 28-31 января 2008 г. Институт проблем управления им. В.А. Трапезникова РАН. М: Институт проблем управления им. В.А. Трапезникова РАН. - 2008. - С. 137-163.
77. Дудин П.А. Применение алгоритма муравьиной колонии для идентификации нечетких моделей // Материалы XLV Международной научной конференции "Студент и научно-технический прогресс": Информационные технологии. НГУ. - Новосибирск, 2007. - С. 188-189.
78. Лоули Д. Факторный анализ как статистический метод / Д. Лоули, А. Максвелл. -М.: Мир, 1967.-144 с.
79. Ким Дж. Факторный, дискриминантный и кластерный анализ / Дж. Ким, Ч.У. Мюллер. — М.: Финансы и статистика, 1989. - 215 с
80. Харман Г. Современный факторный анализ. - М.: Статистика, 1972. - 483 с.
81. Жуковская В.М. Факторный анализ в социально-экономических исследованиях / В.М. Жуковская, И.Б. Мучник. - М.: Статистика, 1976. - 152 с.
82. Иберла К. Факторный анализ. Пер. с нем. - М.: Статистика, 1980. - 398 с.
83. Наследов А.Д. Математические метода психологического исследования. Анализ и интерпретация данных. Учебное пособие. - СПб.: Речь, 2004. — 392 с.
84. Разложение Холецкого [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/Cholesky_decomposition, свободный (дата обращения14.09.2012).
85. Trefethen Lloyd N. Numerical linear algebra / Lloyd N. Trefethen, David Bau. -Philadelphia, USA: Society for Industrial and Applied Mathematics, 1997. - 263 p.
86. LU - decomposton [Электронный ресурс]. - Режим доступа: http://en.wikipedia.org/wiki/LU_decomposition, свободный (дата обращения 14.09.2012).
87. K-means [Электронный ресурс]. - Режим доступа: http://mechanoid.kiev.ua/ml-k-means.html, свободный (дата обращения 06.05.2012).
88. Vance F. Clustering and the continuous k-Means Algorithm. // Los Alamos Science. -1994.-№22.-P. 138-144.
89. Шилдт Герберт. С#: полное руководство. Пер. с англ. - М.: ООО "И.Д.Вильямс", 2011.-1056 с.
90. Официальная страница Vision Studio 2012 (EN) [Электронный ресурс]. - Режим доступа: http://www.microsofit.com/visualstudio/rus/downloads, свободный (дата обращения 05.08.2012).
91. Официальная страница ReSharper (EN) [Электронный ресурс]. — Режим доступа: http://www.jetbrains.com/resharper/download/, свободный (дата обращения 14.08.2012).
92. Дудин П.А. Унифицированное представление параметров нечеткой системы / П.А. Дудин, И.В. Горбунов, A.B. Боровков // Материалы докладов Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых "Научная сессия ТУСУР-2011 ".-Томск: "В-Спектр",2011.-4.2. — С. 168-170.
93. Перемитина Т.О. Исследование влияния химического состава и условий залегания нефтей на численность и активность пластовой микрофлоры в задачах повышения нефтеотдачи на основе статистического анализа / И.Г. Ященко, Л.И. Сваровская, Т.О. Перемитина // Экспозиция Нефть Газ . - 2013. - № 2. - С. 35-38.
94. Ткачев Ю. А. Статистическая обработка геохимических данных / Ю.А. Ткачев, Л.Э. Юдович. - М.: Наука, 1986. - 123с.
95. Сухотин A.M. Коррозия под действием теплоносителей, хладагентов и рабочих тел. - Ленинград, "Химия", 1988. - 360 с.
96. Зайнуллин P.C. Ресурс трубопроводных систем. - Уфа: Изд-во "БЭСТС", 2005. -
836 с.
97. Лукнер Р. Моделирование миграции подземных вод / Р. Лукнер, В.М. Шестаков. -М.: Недра, 1986.-208 с.
98. Лучкова С.О. Система автоматизированного прогнозирования состава и свойств нефти новых месторождений / С.О. Лучкова, Т.О. Перемитина, Д.А. Семыкина // Сб. трудов VII всероссийской научно-практической конференции студентов, аспирантов и молодых ученых "Молодежь и современные информационные технологии". - Томск: Изд-во ТПУ, 2009. — С. 273274.
99. Лучкова С.О. Вопросы анализа данных о нефтях и органическом веществе пород на основе статистических методов / Т.О. Перемитина, Ю.М. Полищук, О.В. Серебренникова, С.О. Лучкова, Д.А. Семыкина // Материалы VII Международной конференции "Химия нефти и газа", - Томск: Изд-во ИОА СО РАН, 2009. - С. 166-168.
100. Лучкова С.О. Вопросы анализа данных о нефтях на основе статистических методов / С.О. Лучкова, Т.О. Перемитина, Д.А. Семыкина // Материалы IV Всероссийской
конференции молодых ученых "Материаловедение, технологии и экология в 3-м тысячелетии". - Томск: Изд-во ИОА СО РАН, 2009. - С. 620-624.
101. Лучкова С.О. Построение модели прогноза свойств нефти новых месторождений / С.О. Лучкова, Д.А. Семыкина, Н.А. Доброжинская, А.А. Голубева, Г.Ю. Цуленкова // Материалы докладов Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых "Научная сессия ТУСУР - 2010". - Томск: "В-Спектр", 2010. - 4.4. - С. 234237.
102. Лучкова С.О. Идентификация нечеткой системы на основе классической эволюционной стратегии // Сб. трудов IX всероссийской научно-практической конференции студентов, аспирантов и молодых ученых "Молодежь и современные информационные технологии". - Томск: Изд-во ТПУ, 2011. - 4.1. - С. 272-274.
103. Лучкова С.О. Нечеткие системы в задачах импутирования // Сборник трудов XVIII Международной научно-практической конференции студентов, аспирантов и молодых ученых "Современные техника и технологии". - Томск: Изд-во ТПУ, 2012. - Т.2. - С. 347-349.
104. Лучкова С.О. Алгоритмы нечетких систем в задачах импутирования // Материалы III Всероссийской молодежной научной конференции "Современные проблемы математики и механики". — Томск: Изд-во Том. ун-та, 2012. - С. 329-334.
105. Лучкова C.B. Методические вопросы применения нечетких системы в задачах анализа многомерных данных // Материалы Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых "Научная сессия ТУСУР-2012". — Томск: "В-Спектр", 2012.-Ч. 4.-С. 128-131.
106. Лучкова C.B. Методы статистического анализа и нечетких систем в исследованиях влияния химического состава и условий залегания нефтей на численность и активность пластовой микрофлоры в задачах повышения нефтеотдачи / C.B. Лучкова, И.Г. Ященко, Л.И. Сваровская, Т.О. Перемитина // Материалы VIII Международной конференции "Химия нефти и газа" - Томск: ТГУ, 2012. - С. 299-302.
107. Лучкова C.B. Применение нечеткого моделирования в задаче импутирования данных / C.B. Лучкова, Т.О. Перемитина, И.Г. Ященко // Материалы 10 электронной конференции "Информационно-вычислительные технологии в решении фундаментальных проблем и прикладных научных задач", декабрь 2012 г. - http://www.ivtn.ru/2012/pdf/dl2_12.pdf.
108. Лучкова C.B. Комплексный анализ многомерных данных на основе нечеткого и статистического моделирования в задачах повышения нефтеотдачи / C.B. Лучкова, Т.О. Перемитина, И.Г. Ященко // Добыча, подготовка, транспорт нефти и газа: Материалы VI
Всероссийской научно-практической конференции [Электронный ресурс]. - Электронные данные. - Томск: Изд-во ИОА СО РАН, 2013. - 1 CD-ROM
109. Лучкова С.В. Применение программного комплекса анализа многомерных данных на основе нечеткого и статистического моделирования / С.В. Лучкова, Т.О. Перемитина, И.Г. Ященко // Информационные технологии. - 2014. - № 1. - С. 24-30.
110. Лучкова С.В. Повышение наглядности отображения результатов факторного анализа / С.В. Лучкова, Т.О. Перемитина // Доклады ТУСУРа - 2013,- № 4. - С. 159-163.
111. Лучкова С.В. Программный комплекс восстановления пропущенных значений в многомерных данных на основе методов нечеткого моделирования / С.В. Лучкова, Т.О. Перемитина, И.Г. Ященко // Программные продукты и системы. - 2014. - № 1. - С. 80-86.
112. Лучкова С.В. Комплексная оценка экологических рисков аварийных разливов нефти / С.В. Лучкова, Т.О. Перемитина, И.Г. Ященко // Защита окружающей среды в нефтегазовом комплексе. - 2014. - № 4. - С. 5-9.
113. Лучкова С.В. Программа "Эволюционная стратегия", зарегистрирована в государственном Реестре программ ЭВМ. Свидетельство о регистрации № 2013619931 от 21.10.2013 г.
те®0шпй(0ж!ш 'шщкршщш
ш
ш
ш
ш т
шшшшшш
СВИДЕТЕЛЬСТВО
о государственной регистрации программы для ЭВМ
№ 2013619931
Эволюционная стратегия
Правообладатель: Лучкова Софья Викторовна (ЯП)
Автор: Лучкова Софья Викторовна (К11)
Заявка № 2013618075
Дата поступления 10 сентября 2013 г.
Дата государственной регистрации в Реестре программ для ЭВМ 21 октября 2013 г.
Руководитель Федеральной службы по интеллектуальной собственности
Б. П. Симонов
ш
ш
ш ш т
&
ш
шшшш^шшшшшштшшшшштшштшшшшшшшштш^
У 1вср'/клаи)
Директор 11X1 К О РАН
Д. I Н
\лг\нциа Л .К.
.< л.' ¿л. Р
2014 I.
АКТ
/
о внедрении реплыатов диссертационной работы Лучковой Софьи Викторовны <■ А.н ориiмы и программный комплекс апатии многомерных данных о природных объектах с применением сштиешческою и hcmcikoiо моделирования«
В даборашрии "f!а>ч но-н ее.ю.юваiе.iьский информационный центр с музеем неф!ей" 1 IXi i СО РАН проводяiси исследования но icmc ^РафаГннка методических »опросов восстановления пропущенных значении в выборочном массиве и? б;пы данных но свойствам вязких парафинистых нефтей с испольюванием меюдов вероягносгного мо аудирования и кластерно! о аиади m данных/-. Рафаботанный в диссер]анионной работе .Ъчковои (\В программный комплекс, основанный па новом подходе к обработке mhoi омерных данных с применением статистическою и нечеткою моде тире на ни я. пере шп в лабораторию "На>чно-иседедова1едьский информационный пешр с м\*еем нефтеи" 11X11 ( О Р\Н и испо.н»5\е1ся для восстановления пропчшейных значений и uopaoojkn mhoi омерных данных о свойствах нефти Указанный коми ickc повышает операпншосп. оорашмкн данных и иамядность предекшлення реп нданж ангина
Применение программною средства ноэво 1яе$ расширять объем выборки дли проведения анади ¡ичсскои обработка информации и nctu).н,кования бо ¡ее полных инныч 1ю применение пошодяет решать такие задачи. как нес ¡едование пространственных и временных изменении свойств нефти в шшеичоеш от ди толот ическич характеристик и iacsoB. но фа*., а и i 1>иины «летания. а также Д1 я вмяв тения н шяния химическою состава нефти на и '.менсние свойств и iaeioBon чикроф ¡оры
Злве1\юшая табораторией "Плутоне». тедоткпельскнп информационный ^
ценф с м> ?еем ьеф ci< ч i -м и
/
/
ТУСУР
Миннсгерство образования и на\ки Федеральное гос\ вдрственное образоватечьное ччреллемие высшего профессионального образования
Томским государственный университет chcicm управления и радиоэлектроники
()к1ю<сш12б oli'h idz'otxihfi'ubli ИНН 70210'Ч!!)4"? КПП "0Г010О1
634050 rlinick ир !енин> 40
те 7 0822)510330
факс (3822) 513262 526365
e-mail office à tusur ru
hifp Wtttt ШЧ1Г ni
Xi!_
на №
от
от
«УТВЕРЖДАЮ»
Первый проректор- проректор по учебной работе Томского государственного университета систем управления и ^ радиоэлектроники
Ц --"""чП.А. Боков
« 2014 г.
[АКТ]
АКТ
i
?
о внедрении резулыаюв диссертационной рабогьиЛучковой Софьи Викторовны в учебный процесс , t -f*
Комиссия в составе: Председателя-
Ехлакова Ю.П., д.т.н.. профессора, зав. каф. АОИ ГУСУРа; Членов комиссии:
Силич M П.. д.i л , профессора каф. АОИ 1 УСУРа; Решежикова М.Т . к.т.н.. профессора каф. АОИ ТУСУРа; составила настоящий акт о пилестеду юшем:
Результаты диссертационной работы С'.В. Лучковой используются в учебном процессе на факультете chcicm управления ТУСУР при чтении курса лекций по дисциплине «Качество программных систем» для подготовки специалистов по специальное гям 080500.62 - «Бизнес-информатика» Алгоритмы программного комп ]екса применяются при проведении лабораторною практикума, яв 1яясь инструментом анализа показателей качества программной системы
---
Ехлаков ЮЛ I.
Ч„ ( <- <■
Силич М.П. Решетников М.Т
Утверждаю
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.