Методы и модели интеллектуального анализа данных в задачах управления в социальных и экономических системах тема диссертации и автореферата по ВАК РФ 05.13.10, кандидат технических наук Орешков, Вячеслав Игоревич

  • Орешков, Вячеслав Игоревич
  • кандидат технических науккандидат технических наук
  • 2013, Рязань
  • Специальность ВАК РФ05.13.10
  • Количество страниц 221
Орешков, Вячеслав Игоревич. Методы и модели интеллектуального анализа данных в задачах управления в социальных и экономических системах: дис. кандидат технических наук: 05.13.10 - Управление в социальных и экономических системах. Рязань. 2013. 221 с.

Оглавление диссертации кандидат технических наук Орешков, Вячеслав Игоревич

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ОБЗОР И СРАВНИТЕЛЬНЫЙ АНАЛИЗ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ, МОДЕЛЕЙ И МЕТОДОВ DATA

MINING

1.1. Постановка задачи

1.2 Классификация и сравнительный анализ инструментов DM

1.3. Выбор класса DM-инструментов для реализации аналитического

проекта масштаба предприятия

Выводы по 1-й главе

ГЛАВА II. РАЗРАБОТКА ДВУХУРОВНЕВОГО СЦЕНАРНОГО ПОДХОДА К РЕАЛИЗАЦИИ DM-ПРОЕКТОВ НА ОСНОВЕ

АНАЛИТИЧЕСКИХ ПЛАТФОРМ

2.1. Постановка задачи

2.2 Разработка 2-уровневого сценарного подхода к организации аналитического процесса

2.4. Разработка сценариев II уровня

2.4.1. Сценарий построения модели численного предсказания на основе

Т-ГРМППТ-ГЫПЪТ Г^ТТ/Г

XXV X А^/ V/ Л. XX X V/ 11 v V XXX •••••••••••••••••••••••••••••••••■•«••«•••••«••«•«••«•«■•«••«••••••••••••••»«••«•••«••«••••»••^ I

2.4.2 Сценарий для построения классификационной модели на основе дерева решений

2.4.3 Построение кластерной модели на основе карты Кохонена

2.4.4. Построение ассоциативной классификационной модели на основе метода Apriori

2.5. Разработка интеллектуальной модели для оценки сложности аналитических проектов

ГЛАВА 3. РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ МОДЕЛИ УРОЖАЙНОСТИ ЗЕРНОВЫХ ПО ДАННЫМ АГРОХИМИЧЕСКОГО

ОБСЛЕДОВАНИЯ ПОЧВ

3.1. Постановка задачи

3.2. Исходные данные для моделирования

3.2. Построение нейросетевой модели урожайности

3.3. Моделирование урожайности с помощью деревьев решений

3.4.1. Постановка задачи

3.4.2. Построение карты Кохонена

3.4.2. Обучение карты Кохонена

3.4. Моделирование урожайности на основе ассоциативного анализа

3.4.1. Постановка задачи

3.6.2. Генерация ассоциативных правил

3.5.3. Актуальность ассоциативных правил

3.6.4. Ассоциативные модели

3.6.5. Практическая работа с ассоциативной моделью

3.5. Оценка обобщающей способности моделей урожайности

3.6. Построение ансамбля моделей

3.6.1 Выбор метода построения ансамбля

3.6.2. Построение ансамбля моделей на основе стекинга

Выводы по 3-й главе

ГЛАВА 4. РАЗРАБОТКА БИНАРНОЙ КЛАССИФИКАЦИОННОЙ МОДЕЛИ ДЛЯ АНАЛИЗА КЛИЕНТСКОЙ БАЗЫ КРЕДИТНОЙ ОРГАНИЗАЦИИ

4.1. Постановка задачи

4.2. Описание источника данных

4.3. Снижение размерности исходных данных

4.3. Построение моделей отклика

Выводы по 4 главе

Заключение

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

Рекомендованный список диссертаций по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы и модели интеллектуального анализа данных в задачах управления в социальных и экономических системах»

ВВЕДЕНИЕ

Актуальность темы исследования. Ключевым фактором обеспечения качественного управления в социальных и экономических системах является организация непрерывного поиска новых, нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для эффективной поддержки принятия управленческих решений (УР). Важнейшим инструментом поиска таких знаний является глубокий и всесторонний анализ данных, описывающих процессы и явления, протекающие в социальных и экономических системах, с использованием современных информационных технологий.

Высокая динамика и сложность современной экономической и социальной сфер предъявляет особые требования к организации таких исследований. Смещение центров принятия УР от высших эшелонов управления на уровень специалистов, непосредственно интегрированных в социальные, экономические и бизнес процессы, требует разработки методов и моделей анализа данных, которые могут применяться на практике широким кругом лиц, не имеющими специального образования. Результаты анализа должны быть обобщаемы и тиражируемы для возможности применения построенных моделей для решения аналогичных задач на новых данных.

Наиболее перспективным направлением информационных технологий, используемым для организации поддержки принятия решений в социальных и экономических системах, в настоящее время является интеллектуальный анализ данных (ИАД), также известный как Data Mining (DM) - раскопка, разработка данных. Это междисциплинарное направление, включающее элементы искусственного интеллекта, математической статистики и машинного обучения, применяемых для решения задач численного предсказания, классификации, кластеризации и ассоциативного анализа.

Вместе с тем DM не дает шаблонов готовых решений и не предписывает строгих алгоритмов для той или иной задачи анализа. Он представляет собой методологию организации аналитической обработки данных, приемы и методы которой позволит извлечь из них максимум полезных знаний. Ядром

аналитических технологий БМ являются методы машинного обучения, позволяющие в автоматическом режиме восстанавливать структуры, зависимости и закономерности в данных, интерпретация и осмысление которых экспертом или аналитиком, позволяет делать заключении и выводы об особенностях состояния и развития явлений и процессов, вырабатывать рекомендации по более эффективному управлению ими.

Процесс внедрения БМ-технологий в практическую деятельность предприятий и организаций для решения конкретных задач повышения эффективности управления, в большинстве случаев достаточно затратный и трудоемкий. Основными проблемами являются отсутствие формальной постановки задачи и стратегии поиска знаний, эвристический характер большинства интеллектуальных моделей, высокая размерность и низкое качество исходных данных. Поэтому разработка новых подходов и методов по реализации ОМ-проектов при решении конкретных задач повышения эффективности управления в социальных и экономических системах, является актуальным.

Степень разработанности проблемы. В качестве отправного этапа развития методов анализа данных с целью извлечения полезных знаний можно рассматривать работы Паскаля и Ферма по применению вероятностных моделей к статистическим данным еще в 17 веке. В 18-19 веках значительный вклад в развитие практической статистики внесли Гаусс, Кетле, а в 20 в. - К. Пирсон, Р. Фишер, У. Госсет (Стьюдент), Вальд, а также советские математики А.Н. Колмогоров, А. Я. Хинчин, Н.В. Смирнов, Б.В. Гнеденко и другие.

Зарождение ИИ как научного направления относится к первой половине 17 в., а именно работам Р. Декарта «Рассуждение о методе» и Т. Гиббса «Человеческая природа», в которых была заложена теория механистического материализма, рассматривающая живые организмы как некий сложный механизм. Технологическими предпосылками ИИ были работы над созданием механических вычислительных машин В. Шикарда (1623), Б. Паскаля (1643), К. Лейбница (1671), Ч. Беббиджа, Л. Лавлейс и С.Н. Корсакова в 19 в. Начало формирование ИИ как науки можно отнести к работе Б. Рассела и А. Уайтхе-

да «Начала математики», где показывалась возможность определения основных понятий математики в терминах логики. Но подлинный расцвет ИИ начинается 50-х годах XX в. с появлением ЭВМ и развитием нейроинформати-ки. Большой вклад в развитие ИИ внесли Н. Винер, Д. Маккарти, А. Тьюринг. В 1943 г. У. Мак-Каллок и У. Питтс предложили концепцию искусственной нейронной сети и модель искусственного нейрона. В работе «Организация поведения» Д. Хебба (1949) описаны основные принципы обучения нейронов, впоследствии развитые американским нейрофизиологом Ф. Розенб-латтом, который разработал устройство, моделирующее процесс распознавания образов мозгом, и назвал его «персептроном». В 1960-х годах ряд пионерских работ в области ИИ был выполнен советскими учеными Д.А. Поспеловым, В.Ф. Турчиным, С. Масловым и др.

При разработке систем ИИ используются два основных подхода: семиотический — создание экспертных систем, баз знаний и систем логического вывода, и биологический — моделированием интеллектуального поведения на основе биологических элементов. В рамках первого подхода получила развитие инженерия знаний (ИЗ), а в рамках второго - машинное обучение (МО) - самостоятельное приобретение знаний интеллектуальной системой в процессе её работы. Последние два направления являются основой БМ, и тесно связаны с понятием индуктивного вывода.

Большой вклад в развитие ИИ и МО внесли зарубежные ученые Б. Уидроу, М. Мински, П. Дж. Вербос, Дж. Хопфилд, Д. Румельхарт, С. Пайперт, и отечественные: А.Б. Новиков, А. И. Галушкин, А.Н. Горбань, С.И. Барцев, В.А. Охонин, В. Н. Вапник, А .Я. Червонескис, Ю.И. Журавлев, К.В. Рудаков и др.

В 70-80 г. XX в. в рамках МО были предложены такие алгоритмы анализа как деревья решений (Дж. Р. Куинлен, Л. Брейман), ассоциативные правила и последовательные шаблоны (Р. Агравал, Р. Шрикант), самоорганизующиеся карты признаков (Т. Кохонен), машины опорных векторов (В. Вапник) и др.

Формирование БМ как направления, в рамках которого были объединены методы «обнаружения в данных ранее неизвестных, нетривиальных,

практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности», началось в конце 80-х начале 90-х годов 20 в. Идеологом направления стал Г. Пятецкий-Шапиро, который и ввел термин в 1989 г.

Значительный вклад в области моделирования социальных и экономических систем с целью анализа их функционирования и синтеза управленческих решений внесли В.Н. Бурков, Д.А. Новиков и др.

Предметом исследования в работе являются методы и алгоритмы DM, методология и проблемы их применения в задачах моделирования объектов и процессов в экономической, социальной и бизнес среде.

Объектом исследования избраны: аналитические технологии Data Mining, технологии машинного обучения: нейронные сети, деревья решений, карты Кохонена, ассоциативные правила, методы их применения для реализации практических задач в социальной, экономической и бизнес среде.

Цели диссертационной работы. Целью диссертационной работы является разработка методов и моделей анализа социальных и экономических систем с использованием аналитических технологий Data Mining для повышения эффективности синтеза управленческих решений на основе знаний, обнаруженных в массивах данных.

Для реализации поставленной цели в диссертационной работе были поставлены и решены следующие задачи:

1) провести обзор и сравнительный анализ инструментальных средств DM и существующих подходов к организации процесса интеллектуальной аналитической обработки данных, разработана система критериев и классификации аналитических инструментов;

2) определить основные факторы, влияющие на успешное внедрение аналитических DM-проектов на уровне специалистов, непосредственно интегрированных в процессы управления в социальных и экономических системах, разработана модель для оценки сложности аналитических DM-проектов;

3) разработать концепцию сценарного подхода к организации интеллектуальной среды аналитического ЭМ-приложения на основе межотраслевого стандарта организации интеллектуального анализа данных СШ8Р-ОМ;

4) разработать сценарии построения базовых интеллектуальных моделей на основе нейронных сетей, деревьев решений, карт Кохонена, и интерфейс пользователя для их реализации;

5) разработать комплексную интеллектуальную модель урожайности зерновых по данным агрохимического обследования почв на основе нейронной сети, дерева решений, карт Кохонена и ассоциативной модели, агрегируемых в ансамбль на основе алгоритма стекинга;

6) разработать комплексную модель для анализа клиентской базы кредитной организации на основе ансамбля моделей, основанных на машинном обучении.

Область исследования. Диссертационная работа выполнена в рамках п. 1.10. «Разработка методов и алгоритмов интеллектуальной поддержки принятия управленческих решений в экономических и социальных системах» и п. 1.12. «Разработка новых информационных технологий в решении задач управления и принятия решений в социальных и экономических системах», паспорта специальности 05.13.10 - «Управление в социальных и экономических системах». Теоретическую и методологическую основу исследования составили современная теория прикладной статистики, машинного обучения, искусственного интеллекта, теории информации, агротехнологий. В процессе работы над диссертацией использовались труды отечественных и зарубежных ученых в области моделирования экономических и социальных объектов и явлений на основе методов математической статистики, искусственного интеллекта и машинного обучения.

Информационно-эмпирическую базу исследований составили ведомости агрохимического обследования почв ОАО СГЖ «Рассвет» Тульской области и набор анкетных данных клиентов компании, специализирующейся в области потребительского кредитования. Обработка данных производи-

лась на основе свободно распространяемой аналитической платформы Deductor Academic российской компании «ООО Аналитические технологии» (www.basegroup.ru).

Положения, выносимые на защиту и их научная новизна.

1. Система классификации программных средств Data Mining с целью выбора программного обеспечения для реализации и внедрения проектов интеллектуального анализа данных. Существенными отличиями являются:

- максимально широкой охват инструментальных средств DM различных разработчиков и уровней сложности;

- разработка критериев и рекомендаций для выбора DM-средств с точки зрения внедрения на уровне специалистов, непосредственно интегрированных в процессы в социальных и экономических системах.

2. Двухуровневый сценарный подход к организации и управлению аналитическими проектами DM в области моделирования социальных и экономических систем в соответствии со стандартом CRISP-DM. Существенными отличиями от существующих подходов являются:

- иерархически структурированная последовательность операций аналитической обработки данных, представляемая в виде дерева с возможностью управления процессом моделирования посредством модификации его узлов и ветвей;

- сценарии построения интеллектуальных моделей, основанных на машинном обучении, с использованием декомпозиции процесса моделирования на этапы, реализуемые с помощью эвристических процедур;

- интеллектуальный интерфейс пользователя для реализации разработанных сценариев.

3. Комплексная модель урожайности зерновых по данным агрохимического обследования почв с помощью ансамбля интеллектуальных моделей, основанных на машинном обучении, агрегируемых с использованием стекинга. Основными отличиями являются:

- комплексное использование нескольких типов интеллектуальных моделей (нейронной сети, дерева решений, карты Кохонена и ассоциативной классификации) позволяет сопоставлять и сравнивать результаты, полученные с помощью различных моделей с целью оценки их согласованности и достоверности;

- концепция интеллектуального моделирования урожайности, позволяющая перейти от использования ретроспективных данных, к пространственным, что, в частности, более удобно для организации точного земледелия;

- усовершенствованный алгоритм построения дерева решений с автоматическим выбором наиболее значимого атрибута разбиения в условиях неопределенности критерия Gain-Ratio, на основе остаточной взаимной энтропии;

- усовершенствованная модель ассоциативной классификации на основе алгоритма поиска ассоциативных правил Apriori с использованием нового показателя - актуальности правил.

4. Комплексная интеллектуальная модель для анализа клиентской базы кредитной организации с целью совершенствования маркетинговой стратегии на основе исследования зависимости свойств клиента и его отклика на коммерческие предложения. Основными отличиями являются:

- комплексное применение нескольких моделей с целью повышения достоверности результатов и объясняющей способности бинарной классификации;

- методика сокращения размерности пространства входных признаков в условиях наличия большого количества числовых и категориальных факторов в исходных данных на основе применения дивергенции Кульбака-Лейблера.

Практическая значимость исследования заключается в том, что сформулированные выводы и предложения, разработанные подходы и модели могут быть использованы широким кругом специалистов, занимающихся разработкой и внедрением проектов интеллектуального анализа данных на основе аналитических платформ и приложений. Модель урожайности на основе данных arpo-

химического обследования почв может быть использована предприятиями АПК, специализирующимися в области растениеводства, для повышения эффективности управления производством на основе оценивания урожайности с целью оптимизации агротехнологических мероприятий и определения их экономического эффекта. Модель реакции клиентов на рекламную рассылку по анкетным данным может использоваться компаниями в области потребительского кредитования, для повышения эффективности маркетинговой стратегии.

Апробация результатов работы. Основные результаты исследования докладывались и обсуждались на:

- Международной научно-практической конференции Дни науки (Прага, 2011);

- VII Международной научной конференции «Гуманитарные науки и современность» (Москва, 26 сентября 2012 г.);

- Всероссийской научно-практической конференции «Актуальные проблемы и их инновационные решения в АПК» (Рязань, 2011);

- семинарах и научных сессиях учетно-экономического факультета Рязанского государственного агротехнологического университета;

- семинарах и научных сессиях Рязанского государственного радиотехнического университета;

- научно-практической конференции «Интеграция науки с сельскохозяйственным производством» (Рязань, 2011);

- результаты диссертационного исследования использовались в НИР "Разработка системы поддержки принятия решений в структурах АПК на основе современных платформ бизнес-аналитики", поддержанной субсидией Министерства сельского хозяйства и продовольствия Рязанской области на проведение работ по разработке приоритетных направлений научно-технического прогресса в агропромышленном комплексе.

Внедрение результатов исследования. Предложенные методы и модели аналитической обработки данных прошли успешную верификацию на реальных данных. Отдельные результаты диссертационного исследования нашли

применение в практической деятельности компании ООО «НАНОАГРОТЕХ», ООО «Аналитические технологии». Результаты исследований применяются при чтении курсов лекций «Информационные технологии в экономике», в Рязанском государственном агротехнологическом университете, «Интеллектуальные подсистемы САПР» в Рязанском государственном радиотехническом университете, «Статистика» по специальности «Государственное и муниципальное управление» и «Управление персоналом» в Рязанском государственном университете им. С.А. Есенина.

Публикации. По теме диссертационного исследования опубликовано 18 работ, в том числе:

- 6 статей в изданиях, рекомендованных ВАК РФ;

- 1 монография (2 издания: 2009 и 2011 г.);

- 1 учебное пособие;

- 10 работ в изданиях, зарегистрированных в Госкомнадзоре РФ и сборниках трудов научных и научно-практических конференций.

Похожие диссертационные работы по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК

Заключение диссертации по теме «Управление в социальных и экономических системах», Орешков, Вячеслав Игоревич

Выводы по 4 главе

Таким образом, в 4-й главе разработана комплексная интеллектуальная модель для анализа клиентской базы кредитной организации с целью повышения эффективности рекламных акций, основанных на почтовой рассылке. В качестве базовых моделей классификатора использовались НС, ДР и модель логистической регрессии, оптимизированная по кривой ошибок.

В результате, была обнаружена целевая группа клиентов, которая наиболее охотно откликается на коммерческие предложения: люди в возрасте до 32 лет, имеющие доход свыше 18 ООО руб., а также среднее специальное или высшее образование. Использование данной информации позволило повысить процент отклике по рекламной рассылке на 18%.

ЗАКЛЮЧЕНИЕ

Таким образом, в работе рассмотрены теоретические, методические и практические аспекты использования технологий и методов БМ для поиска полезных знаний, используемых в процессе поддержки принятия решений в социальных и экономических системах и решены следующие задачи.

1. На основе проведенного в работе обзора и сравнительного анализа инструментальных средств ОМ и существующих подходов к организации процесса интеллектуальной аналитической обработки данных, была разработана система критериев и классификации аналитических инструментов на основании которых были сделаны выводы и сформулированы рекомендации по выбору программных средств БМ для внедрения аналитических проектов масштаба предприятия;

2. На основе анализа ранее реализованных аналитических проектов в различных проблемных областях были определены основные факторы, влияющие на успешное внедрение аналитических ЭМ-проектов на уровне специалистов, непосредственно интегрированных в процессы управления в социальных и экономических системах, разработана модель для оценки сложности аналитических ВМ-проектов. Применение данных моделей позволило сократить среднее время разработки и внедрения аналитических проектов сравнимой сложности платформе Беёиаог на 7%;

3. Разработана концепция сценарного подхода к организации интеллектуальной среды аналитического БМ-приложения на основе межотраслевого стандарта организации интеллектуального анализа данных СШБР-ОМ;

4. Разработаны сценарии построения базовых интеллектуальных моделей на основе нейронных сетей, деревьев решений, карт Кохонена, и интерфейс пользователя для их реализации;

5. Разработана комплексная интеллектуальная модель урожайности зерновых по данным агрохимического обследования почв на основе нейронной сети, дерева решений, карт Кохонена и ассоциативной модели, агрегируемых в ансамбль на основе алгоритма стекинга. Практическое внедрение модели на предприятиях АПК, специализирующихся на выращивании зерновых, позволило снизить среднюю себестоимость продукции на 3,2% и повысить среднюю урожайность на опытных полях на 5,2%;

6. Разработана комплексная модель для анализа клиентской базы кредитной организации на основе ансамбля моделей, основанных на машинном обучении. С помощью модели были определены основные целевые группы клиентов с повышенным процентом отклика на рекламные акции. Практическое внедрение модели позволит повысить процент отклика клиентов на рекламные акции, проводимые на основе директ-маркетинга на 18%.

Список литературы диссертационного исследования кандидат технических наук Орешков, Вячеслав Игоревич, 2013 год

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1.Абдикеев Н.М. Проектирование интеллектуальных систем в экономике: Учебник/Под ред. Н.П. Тихомирова. —М.: Экзамен, 2004. — 528 с.

2. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин JI. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989. - 608 с.

3.Арустамов А.И., Васильев Е.П., Орешков В.И. Интеллектуальные платформы - современный инструмент анализа данных в экономике и бизнесе//Сб. трудов Международной научно-практической конференции «Дни науки», Прага, 2012.

4.Архипенков С.Я. Хранилища данных/Архипенков С.Я., Голубев Д.В., Максименко О.Б. — М.: Диалог-МИФИ, 2002. - 528 с.

5.Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. пособие. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. - 304 с : илл. — (Информатика в техническом университете).

6.Барсегян А. А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / Барсегян А. А., Куприянов M.C., Степаненко B.B., Холод И.И. - 2-е изд., перераб. и доп. — СПб.: БХВ-Петербург, 2007. - 382 с.

7.Барсегян A.A. Анализ данных и процессов / А.А.Барсегян, М.С.Куприянов, И.И. Холод, М.Д. Тесс, С.И.Елизаров. 3-е изд. перераб. и доп. СПб.: БХВ-Петербург, 2009. - 512 с.

8.Барцев С. И., Охонин В. А. Адаптивные сети обработки информации. Красноярск: Ин-т физики СО АН СССР, 1986. Препринт N 59Б. — 20 с.

9.Блинкова С.Ю., Васильев Е.П., Орешков В.И. Фильтрация данных в интеллектуальных системах бизнес-аналитики//Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 272 - 277.

10. Васильев Е.П., Орешков В.И. Современные аналитические платформы для задач АПК // Вестник Рязанского гос. агротехнологического университета имени П.А. Костычева. Рязань: РГАТУ.- 2011.- № 1.- С.68-75.

11. Васильєв Е.П., Орешков В.И. Интеллектуальные системы бизнес-аналитики//Интеграция науки с сельскохозяйственным производством: материалы науч. конф. - Рязань: изд. РГАТУ, 2011 - с. 67-71.

12. Васильев Е.П. Объектно-ориентированное программирование: реализация экономических задач в среде Delphi/ Васильев Е.П., Орешков В.И. Уч. пособие. - Рязань: РГАТУ, 2011. - 163 с.

13. Васильев Е.П., Воронкина Н.Ю., Орешков В.И. Трансформация данных в аналитическом приложении Dedictor Studio// Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 277 - 282.

14. Васильев Е.П., Гусев Ю.С., Орешков В.И. Подавление шумов и сглаживание данных в аналитических системах // Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 282 - 290.

15. Васильев Е.П., Орешков В.И., Сычева Т.А. Обработка и предобработка баз данных в задачах АПК// Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 290 - 296.

16. Васильев Е.П., Орешков В.И., Чумакова E.H. Моделирование бизнес-процессов на предприятии АПК в аналитической платформе Deductor// Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 296-304.

17. Васильев Е.П., Орешков В.И., Шаева К.А. Построение модели линейной регрессии в аналитической платформе Deductor// Материалы научно-практической конф. РГАТУ им. П.А. Костычева. Рязань: РГАТУ, 2011 - с. 304 - 310.

18. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. - М.: Наука, 1979. - 448 с.

19. Горбань А. Н., Обобщенная аппроксимационная теорема и вычислительные возможности нейронных сетей, Сибирский журнал вычислительной математики, 1998. Т.1, № 1. С. 12-24.

20. Дюк В., Самойленко A. Data Mining: учебный курс (+CD).. — СПб: Изд. Питер, 2001. — 368 с.

21. Евстропов, A.C. Системы управления и производством сельскохозяйственной продукции на основе информационно-иновационных технологий (монография) / A.C. Евстропов, В.А. Артамонов. - Рязань: ГНУ ВНИМС, 2009. - 196 с.

22. Журавлев Ю.И., Рязанов В.В., Сенько О.В. Распознавание: математические методы, программная система, практические применения. - М.: Фазис, 2005.

23. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: Изд-во Института математики, 1999. — 270 с.

24. Корсаков С.Н. Начертание нового способа исследования при помощи машин, сравнивающих идеи / Под ред. A.C. Михайлова. — М.: МИФИ, 2009. —44 с.

25. Круглов В. В., Борисов В. В. Нейронные сети: теория и практика. — М.: Горячая линия-Телеком, 2001. - 382 с.

26. Мак-Каллок У. С., Питтс В., Логическое исчисление идей, относящихся к нервной активности // В сб.: «Автоматы» под ред. К. Э. Шеннона и Дж. Маккарти. — М.: Изд-во иностр. лит., 1956. — с.363-384.

27. Новиков Д.А. Теория управления организационными системами. М.: МПСИ, 2005.-584 с.

28. Орешков В.И. Интеллектуальный анализ данных как важнейший инструмент формирования интеллектуального капитала организаций.// Креативная экономика. - 2011. - №12. - С. 84-89.

29. Орешков В.И. Интеллектуальный анализ данных как современный инструмент поддержки управленческих решений // Вестник Рязанского гос. агротехнологического университета имени П.А. Костычева. Рязань: РГАТУ. -2011.-№4.-С. 55-59.

30. Паклин Н.Б. Бизнес-аналитика: от данных к знаниям (+С0)/Паклин Н.Б., Орешков В.И. - Изд. 2-е, переработанное и дополненное. -СПб.: Питер, 2010.- 700 с.

31. Розенблатт, Ф. Принципы нейродинамики: Перцептроны и теория механизмов мозга. — М.: Мир, 1965. — 480 с.

32. Смирнов П. М., Муравин Э. А. Агрохимия. -3-е изд., перераб. и доп. -М.: Агропромиздат, 1991.-288 с.

33. Спирли Э. Корпоративные хранилища данных. Планирование, разработка и реализация. Т.1. - М.: Издательский дом "Вильяме", 2001. - 400 с.

34. Уоссермен, Ф. Нейрокомпыотерная техника: Теория и практика. — М.:Мир, 1992. —240 с.

35. Хайкин С. Нейронные сети: полный курс. 2-е. изд. / Пер. с англ. — М.: Вильяме, 2006. - 1104 с.

36. Чураков Е.П. Математические методы обработки экспериментальных данных в экономике. - М.: Финансы и статистика, 2004. - 240 с.

37. Ясницкий JL Н. Введение в искусственный интеллект: учеб. пособие для студ. высш. учеб. заведений /Л. Н. Ясницкий. — 2-е изд., испр. — М.: Издательский центр «Академия», 2008. — 176 с.

38. Advances in data mining : applications in E-commerce, medicine, and knowledge management / Perner. P (ed.). - Berlin: Springer, 2002. - p. 108.

39. Advanced data mining technologies in bioinformatics / Hui-Hwang Hsu, editor. - Idea Group Inc. 2006. - p. 329.

40. Advances in data mining and modeling / Wai-Ki Ching, Michael Kwok-Po Ng, editors. World Scientific Publishing, 2004. - p. 196.

41. Advances in Knowledge Discovery and Data Mining / Fayyad, Usama M., Piatetsky-Shapiro, G. (ed.) - MIT Press, 1996. - p. 234.

42. Advanced Techniques in Knowledge Discovery and Data Mining/ Nikhil R. Pal, Lakhmi Jain (Eds). - London: Springer-Verlag Limited, 2005. - p. 254.

43. Abbass, A. Data Mining: A Heuristic Approach / Abbass, A. Sarker, R. Newton, C. - University of New South Wales, Australia - Idea Group Publishing, 2002.-p. 300.

44. Agrawal R., Srikant R. Mining Sequential Patterns // Journal Intelligent Systems. - 1997. - Vol. 9, No. 1. - P. 33-56.

45. Agrawal R., Mannila H., Srikant R., Toivonen H., Verkamo A.I. Fast discovery of associations rules // In: «Advances in Knowledge Discovery and Data Mining», American Association for Artificial Intelligence, 1996. - P. 307-328.

46. Alpaydin, E. Introduction to machine learning. / Alpaydin, E. - Cambridge: The MIT Press, 2004. - p. 415.

47. Armstrong L. J. The application of data mining techniques to characterize agricultural soil profiles/Armstrong L. J., Diepeveen D, Maddern R. - School of Computer and Information Sciences Edith Cowan University, 2008.

48. Barai, S. Data Mining applications in transportation engineer-ing//Transport - Dept of Civil Engineering, Indian Institute of Technology, 2003, Vol XVIII, No 5, 216-223.

49. Berry, M. Data mining techniques: for marketing, sales, and customer relationship management / Berry, M., Linoff, G. — 2nd ed. Wiley Publishing, Inc., Indianapolis, Indiana, 2004. - p. 641.

50. Bhowmik, R. Detecting Auto Insurance Fraud by Data Mining Techniques// Journal of Emerging Trends in Computing and Information Sciences. -Volume 2 No.4. - Computer Science Department University of Texas at Dallas, USA. 2011.-p. 156-161.

51. Bigus, Joseph P. Data mining with neural networks: solving business problems—from application development to decision support / Bigus, Joseph P. -McGraw-Hill, 2003. - p. 119.

52. Breiman L., Friedman J., Olshen R., and Stone C. Classification and Regression Trees. Wadsworth and Brooks, Monterey, CA, 1984. - p. 368.

53. Bramer, M. Principles of Data Mining / Bramer, M. - Springer-Verlag London Limited, 2007. - p. 354.

54. Burgess, S. Managing information technology in small business : challenges and solutions / Burgess, S. - Idea Group Publishing, 2002. - p. 361.

55. Cox, E. Fuzzy Modeling and Genetic Algorithms for Data Mining and Exploration (The Morgan Kaufmann Series in Data Management Systems)/ Cox, E. - Morgan Kaufmann, 2005. - p. 530.

56. Cunningham, S. J., Holmes, G. Developing innovative applications in agriculture using data mining. In the Proceedings of the Southeast Asia Regional Computer Confederation Conference, 1999.

57. Dasu, T. Exploratory data mining and data cleaning / Dasu, T., Johnson, T. - John Wiley & Sons, Inc. 2003. - p. 197.

58. Data Mining Using Enterprise Miner™ Software: A Case Study Approach, First Edition, Cary, NC: SAS Institute Inc., 2000. - p. 128.

59. Data Mining: Theory, Methodology, Techniques, and Applications / Williams G. J, Simoff S. J. (Eds.). — Berlin; Heidelberg: Springer-Verlag, 2006. - p. 342.

60. Data mining in time series databases. Series in Machine Perception and Artificial Intelligence (Vol. 57). World Scientific Publishing, 2004. - p. 192.

61. Data mining: practical machine learning tools and techniques / Witten, I., Eibe F. - 3nd ed. - Morgan Kaufmann, 2011. - p. 664.

62. Data mining applications for empowering knowledge societies / Rahman, H. - editor. IGI Global, 2009. - p. 356.

63. Data Mining for Business Applications / Edited by L. Cao, Philip S. Yu, C. Zhang, H. Zhang. — Springer Science; Business Media, 2008. - p. 302.

64. Dong, G. Sequence Data Mining/ Dong, G., Pei, J. - Springer Sci-ence+Business Media, LLC. 2007. - p. 137.

65. Dorian, P. Data Preparation for Data Mining/ Dorian, P. - Morgan Kaufmann Publishers, Inc. 1999. - p. 466.

66. Encyclopedia of Data Warehousing and Mining / Wang, J. (ed.) — Idea Group Inc., 2006. - p. 1348.

67. Giudici, P. Applied data mining: statistical methods for business and industry. John Wiley & Sons Ltd, The Atrium, Southern Gate, Chichester, 2003. - p. 376.

68. Guo, Y. High performance data mining: Scaling Algorithms, Applications and Systems / Guo, Y., Grossman, R., ed. Kluwer Academic Publishers, 2002. - p. 112.

69. Guillet, F. Quality Measures in Data Mining/ Fabrice Guillet, Howard J. Hamilton (Eds.). - Springer-Verlag Berlin Heidelberg 2007. - p. 313.

70. Halusova, P. Effective Data Mining for a Transportation Information System//Acta Polytechnica Vol. 48 No. 1/2008. - Czech Technical University Publishing House. - pp. 24 - 29.

71. Han, J. Data Mining: Concepts and Techniques / Han, J., Kamber, M. -Simon Fraser University. Morgan Kaufmann Publishers, 2000. - p. 550.

72. Hand, D. Principles of Data Mining / Hand, D., Mannila, H., Smyth, H. - A Bradford Book The MIT Press, Cambridge, Massachusetts Institute of Technology, 2001.-p. 425.

73. Harman G. Statistical Learning Theory as a Framework for the Philosophy of Induction / Harman G., Kulkarni S. Princeton University, 2008. - p. 274.

74. Heckerman, D. Bayesian Networks for Data Mining/ Data Mining and Knowledge Discovery 1, 79-119 (1997), Kluwer Academic Publishers.

75. Hsiao H. W. et al. Spatial Data Mining of Colocation Patterns for Decision Support in Agriculture/Asian Journal of Health and Information Sciences, Vol. 1, No. l,pp. 61-72, 2006.

76. Igel C., Toussaint M, Weishui W.Rprop Using the Natural Gradient / International Series of Numerical Mathematics Vol. 1, Birkhauser Verlag, Basel, 2005.

77. Inmon W.H. Building The Data Warehouse / Inmon W.H. - Wiley Publishing, Inc., 2005. - p. 356.

78. Intelligent data analysis: developing new methodologies through pattern discovery and recovery / Wang, H. - F. - editor. IGI Global, 2009. - p. 344.

79. Kantardzic, M. Data Mining—Concepts, Models, Methods, and Algorithms / Kantardzic, M. - John Wiley & Sons, Inc. 2003. - p. 345.

80. Kasabov, N. Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering/ Nikola K. Kasabov. - Massachusetts Institute of Technology, 1999.-p. 581.

81. Kohonen, T. Self-Organizing Maps. / Kohonen, T. - Berlin — New York: Springer-Verlag, 2001. - p. 521.

82. Kovalerchuk B., Vityaev E. Data Mining in Finance. Advances in Relational and Hybrid Methods / Kovalerchuk B., Vityaev E. — New York: Kluwer Academic Publishers, 2002. - p. 368.

83. Krzysztof, J. C. Data Mining A Knowledge Discovery Approach / Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski, Lukasz A. Kurgan. -Springer Science+Business Media, LLC, 2007. - p. 606.

84. Life science Data Mining (Science, Engineering, and Biology Informatics) / Wong, S., Li, C.S., editors. World Scientific Publishing Co. Pte. Ltd. 2006. - p. 388.

85. Larose, Daniel T. Discovering knowledge in data: an introduction to data mining. - John Wiley & Sons, Inc., Hoboken, New Jersey, 2005. - p. 240.

86. Larose, Daniel T. Data mining methods and models. - John Wiley & Sons, 2006.-p. 344.

87. Maimon O, Rokach L. Data Mining and Knowledge Discovery Handbook. Second Edition. Springer Science+Business Media, 2010. - p. 1285.

88. Mathematical methods for knowledge discovery and data mining / Fe-lici, G., Vercellis, C., editors. IGI Global, 2008. - p. 371.

89. Mirkin, B. Clustering For Data Mining: A Data Recovery Approach (Computer Science and Data Analysis)/ Mirkin, B. - Chapman & Hall/CRC, 2005. - p. 266.

90. Mitra, S. Data mining : multimedia, soft computing, and bioinformatics / Mitra, S. Acharya, T. - John Wiley & Sons, Inc., Hoboken, New Jersey, 2002. - p. 401.

91. Mikut, R. Data Mining Tools: Advanced Review / Mikut, R, Markus, R. -John Wiley & Sons, Inc., 2011. -p 13/

92. McNelis, Paul D. Neural Networks in Finance: Gaining Predictive Edge in the Market. Elsevier Academic Press, 2005. - p. 256.

93. Mucherino A. Data Mining in Agriculture / Mucherino A., Papajorji P., Pardalos P. - Springer Science+Business Media, 2009. - p. 292.

94. Myatt, G. Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining/Myatt, G. - Wiley-Interscience, 2006. - p. 292.

95. Nagabhushana S. Datawarehousing: OLAP and Data Mining. - New Age International, New Delhi, 2006. - p. 350.

96. Novikoff, A. B. (1962). On convergence proofs on perceptrons. Symposium on the Mathematical Theory of Automata, 615-622. Polytechnic Institute of Brooklyn.

97. Olson, D. Advanced Data Mining Techniques / Olson, D., Delen, D. -Springer-Verlag Berlin Heidelberg, 2008. - p. 198.

98. Perner, P. Data Mining on Multimedia Data / Perner, P. - SpringerVerlag Berlin Heidelberg 2002. - p. 320.

99. Prabhi, S. Data Mining and Warehousing/ Prabhi, S., Venkatesan, N. -New Age International (P) Ltd., Publishers, 2007. - p. 130.

100. Principles for Government Data Mining Preserving Civil Liberties in the Information Age//The Constitution Project. - Washington, DC, 2010. - p. 40.

101.Pyle, D. Business Modeling and Data Mining / Pyle, D. — Morgan Kaufmann Publishers, 2003. - p. 650.

102.Quinlan, J. R. (1979), Discovering rules from large collections of examples: A case study, in D. Michie, ed., Expert Systems in the Micro Electronic Age, Edinburgh University Press.

103. Quinlan, J. R. (1987), Inductive knowledge acquisition: A case study, in J. R. Quinlan, ed., Applications of Expert Systems, Addison-Wesley, chapter 9, pp. 157-173.

104. Quinlan, J. R.. Induction of decision trees. Machine Learning, 1(1):81-106, March 1986.

105. Quinlan, Ross J. C4.5: Programs for Machine Learning (Morgan Kaufmann Series in Machine Learning). Morgan Kaufmann, January 1993. - p. 302.

106. Rajesh D. Application of Spatial Data Mining for Agriculture / International Journal of Computer Applications (0975 - 8887) Volume 15-No.2, February 2011.

107. Revathi P., Hemalatha M. Efficient Classification Mining Approach for Agriculture. International Journal of Research and Reviews in Information Sciences (IJRRIS) Vol. 1, No. 2, June 2011.

108. Ruß G. Data Mining of Agricultural Yield Data: A Comparison of Regression Models / Otto-von-Guericke-University, Magdeburg, 2005.

109. Ruß G. et al. Visual Data Mining of Agriculture Data / Otto-von-Guericke-University at Magdeburg, 2006.

110. Rud, O.P. Data Mining Cookbook: Modeling Data for Marketing, Risk, and Customer Relationship Management / Rud, O.P. - John Wiley & Sons, 2001. - p. 367.

111. Rumelhart D.E., Hinton G.E., Williams R.J., Learning Internal Representations by Error Propagation. In: Parallel Distributed Processing, vol. 1, pp. 318—362. Cambridge, MA, MIT Press. 1986.

112.Ruppert, D. Statistics and Data Analysis for Financial Engineering. / Ruppert, D. - Springer Science+Business Media, LLC 2011. - p. 638.

113. Sammon, John W. A Nonlinear Mapping for Data Structure Analysis. IEEE Transaction on Computers. Vol. C-18, NO. 5, May, 1969.

114. Simovici D. Mathematical Tools for Data Mining: Set Theory, Partial Orders, Combinatorics / Simovici D., Chabane D. - Springer-Verlag London Limited, 2008. - p. 628.

115. Soukup T. Visual Data Mining: Techniques and Tools for Data Visualization and Mining / Soukup T., Davidson I. — Wiley Publishing, Inc, 2002. - p. 416.

116. The handbook of data mining / Nong Ye (ed.). - London: Lawrence Erlbaum Associates, Inc. - p. 689.

117. The Business Case for Data Mining in the Insurance Industry: Using Enterprise Miner to Model Pure Premium and Establish Policy Rating Struc-tures/Sanford Gayle, SAS Institute Inc., Cary, NC (1999)

118. The Top Ten Algorithms in Data Mining / Edited by by Xindong Wu. -- Chapman & Hall, 2009. - p. 239.

119. Vamanan R. et al. Classification of Agricultural Land Soils a Data Mining / International Journal on Computer Science and Engineering (IJCSE), Vol. 3 No. 1 Jan 2011, p. 379-384.

120. Vapnik, V. The nature of statistical learning theory / Vapnik, V. - 2nd. ed. Springer-Verlag NY, 2000. - p. 333.

121. Vapnik, V. Estimation of Dependences Based on Empirical Data / Vapnik V.N. - 2nd. ed. Springer Science+Business Media, Inc. 2006. - p. 528.

122. Vapnik, V. An Overview of Statistical Learning Theory//IEEE Transaction on neural Networks, Vol. 10, No. 5, September 1999.

123. Vercellis, C. Business Intelligence: Data Mining and Optimization for Decision Making / Vercellis, C. - John Wiley & Sons Ltd, 2009. - p. 436.

124. Werbos P. J., Beyond regression: New tools for prediction and analysis in the behavioral sciences. Ph.D. thesis, Harvard University, Cambridge, MA, 1974.

125. Westphal, Christopher R. Data mining for intelligence, fraud & criminal detection: advanced analytics & information sharing technologies / Westphal, Christopher R. - CRC Press, 2009. - p. 440.

126. Wolberg, J. Data Analysis Using the Method of Least Squares / Wol-berg, J. - Springer-Verlag Berlin Heidelberg 2006. - p. 250.

127. Kullback S., Leibler R.A. On information and sufficiency // The Annals of Mathematical Statistics. 1951. V.22. № 1. P. 79-8

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.