Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Нейский, Иван Михайлович

  • Нейский, Иван Михайлович
  • кандидат технических науккандидат технических наук
  • 2010, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 185
Нейский, Иван Михайлович. Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2010. 185 с.

Оглавление диссертации кандидат технических наук Нейский, Иван Михайлович

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ МЕТОДОВ И СИСТЕМ КЛАСТЕРИЗАЦИИ ФАКТОГРАФИЧЕСКИХ ДАННЫХ.

1-Х- Основные определения.;.

1.2. Методы кластеризации.12'

1.2.1. Классификация методов кластерного анализа.

1.2.3. Сравнение методов кластеризации.

1.3. Сравнение аналитических программных комплексов.

1.4. Предметная область исследования.

1.4.1. Структура рынка ценных бумаг.

1.4.2. Виды ценных бумаг.г.

1.4.3. Участники рынка ценных бумаг.

1.4.4. Брокерская деятельность профессионального участника рынка ценных бумаг.

1.4.5. Основные характеристики предметной области исследования.

1.5. Постановка задачи адаптивной кластеризации.

1.6. Выводы.

ГЛАВА 2. ИССЛЕДОВАНИЕ И АДАПТАЦИЯ СУЩЕСТВУЮЩИХ МЕТОДИК КЛАСТЕРИЗАЦИИ ФАКТОГРАФИЧЕСКИХ ДАННЫХ.

2.1. Формализованная модель предметной области.

2.2. Методика адаптивной кластеризации.

2.3. Выбор метода кластеризации.

2.3.1. Выбор метода на основе рекомендаций.

2.3.2. Выбор метода на основе критериев.

2.3.3. Выбор метода по общему алгоритму.

2.4. Адаптация методов кластеризации.50'

2.4.1. Параметрическая настройка методов кластеризации.

2.4.2. Адаптация методов кластеризации к предметной области.

2.5. Оценка кластеризации.

2.6. Выводы.

ГЛАВА 3; АДАПТИВНАЯ КЛАСТЕРИЗАЦИЯ ФАКТОГРАФИЧЕСКИХ ДАННЫХ СМЕШАННОГО ТИПА.1.

3:1. Базовые принципы метода АО АКБ.60 *

3.2. Входные данные метода АПАКЪ.

3.3. Описание метода АБАКЕ.

3.4. Способы построения минимальных остовных деревьев.

3.5. Адаптация метода к предметной области.

3.6. Аналитическая оценка сложности метода.

3.7. Докластеризация исходных данных в процессе исследования.

3.8. Аналитическая оценка сложности докластеризации.

3.9. Достоинства и недостатки адаптивной кластеризации.

3.10. Обоснование локального критерия оценки качества разбиения

3.11. Выводы.

ГЛАВА 4. ПРОГРАММНЫЙ КОМПЛЕКС АДАПТИВНОЙ КЛАСТЕРИЗАЦИИ.

4.1. Общее описание.

4.1.1. Цель, назначение и область применения разработки.

4.1.2. Функциональные возможности программного решения.

4.1.3. Описание сущностей и их атрибутов.

4.2. Основные алгоритмы*.

4.2.1. Алгоритмы построения минимальных остовных деревьев.

4.2.2. Алгоритм вычисления среднего значения атрибута символьного типа.

• 4.3. Форматы выходных данных.99'

4.4; Интерфейс взаимодействиям пользователем.102'

4.4.1. Граф диалога пользовательского интерфейса.

4.5. Описание эксперимента.102!

4.5.1. Описание сравнительных исследований.

4.5.2. Анализ результатов сравнительных исследований.

4.5.3. Описание оценочных исследований.

4.6. Выводы.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних»

Актуальность

Большинство крупных компаний используют в своей деятельности автоматизированные системы для сбора, обработки и хранения информации, ведущие к росту объемовинформации с каждым днем. Существует оценка, согласно которой объём данных в мире удваивается каждые два месяца [12]. Когда объем операций и, соответственно, информации небольшой, то исследование этой информации с помощью человеческих ресурсов еще возможно. При значительном росте объемов информации компании переходят к применению аналитических программных комплексов, которые позволяют проводить анализ собранных данных и выявлять в них скрытые факты и закономерности.

Изучением проблем и созданием решений в этой области активно занимаются направления Business Intelligence (Интеллектуальный анализ данных) и Knowledge Management (Управление знаниями), в рамках которых выделяются поднаправления Knowledge Discovery in Databases (Выявление знаний в базах данных), Data Mining (Анализ фактографических данных), Text Mining (Анализ неструктурированных данных) и др. В интеллектуальном анализе данных выделены шесть различных классов задач (рис. 1), такие как: классификация, регрессия, кластеризация, выявление ассоциаций, выявление последовательностей, прогнозирование.

Рис. 1. Классы задач ИАД.

Классификация позволяет выявить признаки, характеризующие однотипные группы объектов (классы), для того, чтобы по известным-значениям,этих' характеристик можно было отнести новый объект к тому или иному классу [33].

Регрессия устанавливает зависимости непрерывных выходных переменных от входных переменных [33].

Кластеризация, используя свободный поиск, выделяет в данных признаки, по которым данные можно поделить на группы [33]. Кластеризация неоднозначна, поскольку группировка данных целиком зависит от способа, по* которому измеряется информационное расстояние между записями набора данных. 4

Это задача более сложная, чем классификация, так как классы объектов изначально не предопределены [129]. Еще одним ключевым отличием классификации является то, что каждый объект однозначно относится к соответствующему классу, а при кластеризации объект может относиться к одному, двум и более кластерам (спорный объект). Сложностью кластеризации является необходимость ее оценки.

Ассогщация, в отличие от двух предыдущих задач, определяется не на основе значений свойств одного объекта или события, а имеет место между двумя или несколькими одновременно наступающими событиями [33]. Создаваемые при этом правила указывают на то, что при наступлении одного события с той или иной степенью вероятности наступает другое.

Последовательности, подобно ассоциациям, имеют место между событиями, но наступающими не одновременно, а с некоторым определенным разрывом во времени [33].

Прогнозирование — это особая форма предсказания, которая на основе особенностей поведения текущих и исторических данных оценивает будущие значения определенных численных показателей [33].

В связи с ростом динамики изменений в социально-экономической и научно-производственной среде задача кластеризации актуальна в различных сферах и предметных областях, например: выделение групп клиентов брокерского обслуживания для формирования перечня предлагаемых сервисов; формирование потребительской корзины; принятие решения о выдаче потребительского кредита; сегментирование сферы деятельности с целью повышения эффективности производительности; обработка изображений; тематический анализ биб6 лиотеки документов; оптимизация использования' складских помещений; выявление транзакций, проведенных по поддельным кредитным картам; выявление потенциальных болезней пациентов; построение показательной (репрезентативной) выборки и т.д.

Актуальность.данного направления подтверждается появлением и постоянным увеличением количества прикладного программного обеспечениях (ППО), которое предназначено для решения задач анализа-различных видов и типов данных: в начале 90-х годов рынок ППО насчитывал около десяти поставщиков, а к середине 90-х годов - более пятидесяти компаний малого, среднего и большого размера [92, 129]. Инструменты Интеллектуального Анализа Данных (ИАД)1 могут быть представлены как самостоятельный продукт, а также как составная часть основного программного продукта. Примерами таких программных продуктов являются SPSS (Statistical Package for the Social Sciences, в переводе с англ. - статистический пакет для социальных наук), Statistica (в переводе с англ. - статистика), SAS (Statistical Analysis Software, в переводе с англ. - программное обеспечение для статистического анализа) [46].

Четкое разбиение объектов на кластеры возможно только в идеальных условиях на; хорошо разделимых данных, поэтому все чаще используются нечеткие методы. Важной предпосылкой применения нечетких методик кластеризации в реальных условиях является то, что характеристики объектов не всегда являются измеримыми и поэтому в ряде случаев присутствуют экспертные оценки характеристик объектов, которые являются субъективными и могут быть противоречивыми.

Под методами адаптивной кластеризации в работе понимаются методы, входной параметр «Количество кластеров» которых определяется в результате предварительного исследования, включающего, например, оптимизацию ло

1 Интеллектуальный анализ данных - извлечение информации из данных, добыча данных, технология анализа хранилищ данных, базирующиеся на методах искусственного интеллекта и инструментах поддержки принятия решений. кальных критериев оценки качества разбиения, стабилизацию получаемых центров кластеров1 и др.

На сегодняшний день в области кластерного анализа актуально решение следующих проблем: обоснованный выбор наиболее подходящего метода исследования-, так как он осуществляется из более 100 методов; сложность оценки получаемых разбиений в целях определения качества проведенного исследования, так как существующие критерии позволяют оценить четкость, компактность, эффективность разбиения, но не решают вопрос выбора оптимального решения для исследуемой предметной области; отсутствие рекомендаций по применению существующих методов для использования в исследуемой предметной области - брокерского обслуживания клиентов; выбор значения «Количество кластеров», так как данный параметр является входным для большого количества методов.

Прикладной областью диссертационной работы выбрана сфера брокерского обслуживания клиентов, для которой в настоящее время отсутствует достаточное количество практических рекомендаций по использованию существующих методов кластеризации, которые позволяют проводить регулярные исследования интервальной информации об операциях клиентов. Необходимость решения описанных проблем для данного класса задач обуславливает актуальность разработки методики адаптивной кластеризации.

Целью диссертационной работы является разработка методики адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних.

Для реализации поставленной цели в работе решаются следующие задачи:

1. Исследование методов и систем интеллектуального анализа данных, используемых для кластеризации фактографических данных.

2. Разработка методики адаптивной кластеризации фактографических данных.

3. Разработка рекомендаций по выбору существующих алгоритмов кластеризации.

4. Разработка метода кластеризации.

5. Разработка метода докластеризации.

6. Разработка программного комплекса для автоматизации предложенного метода кластеризации.

7. Оценка эффективности предложенной методики.

Диссертационная работа состоит из введения, четырех глав, заключения, списка использованной литературы и приложений. Общий объем текста диссертации составляет 185 страниц, содержит 30 таблиц, 21 схему, 137 источников, из них 43 зарубежных.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Нейский, Иван Михайлович

Основные результаты диссертационной работы:

1. Проведено исследование существующих методов и подходов интеллектуального анализа данных, используемых для кластеризации фактографических данных.

2. Проведен анализ аналитических программных комплексов с выделением назначения программного комплекса и основных функциональных возможностей.

3. Разработана общая методика адаптивной кластеризации, которая состоит из пяти этапов: выборка исходных данных, исследование полученной выборки с целью выявления значимых для разбиения характеристик, разработка контрольного примера, выбор метода кластеризации, кластеризация полного объема данных.

4. Для выбора метода кластеризации на основе литературных источников выделено восемь критериев.

5. Разработан критерий для оценки качества разбиения, который позволяет проводить оценку и сравнение результатов исследований на основе сравнения* итоговых и ожидаемых количественных показателей разбиения.

6. Разработан метод адаптивной кластеризации (ADAKL) на основе интеграции методов MST и Fuzzy С - Means, определяющий количество кластеров на основе локального критерия, обладающий двухэтапностью, восемью входными параметрами настройки, нечеткостью при распределении объектов по кластерам, возможностью использования объектов с разными типами атрибутов, приемлемым временем работы и конечностью результата.

7. Разработан локальный критерий оценки разбиения множества на кластеры, который учитывает характеристики практической задачи, лежащей в основе научного исследования: выделение кластеров с наименьшими взаимными расстояниями и наибольшим количеством элементов в кластере, минимизация количества кластеров, минимизация взаимных расстояний между получаемыми центрами кластеров и распределяемыми объектами.

8. Разработан метод докластеризации, позволяющий расширять исследованные массивы фактографических данных и уменьшающий затраты времени на проведение исследования за счет выявления взаимных связей между исследованными объектами и добавляемыми объектами.

9. Разработанный метод АБАКХ реализован в виде программного решения, который подтверждает аналитическую оценку.

10. На основе программного решения проведены экспериментальные исследования и оценка состоятельности разработанного метода в сравнении с имеющимися методами (к - средние, карты Кохонена).

11. Выполнена оценка аналитической сложности разработанных методов.

Заключение

Совокупность сформулированных и обоснованных в диссертации-методов и положений, а также её практические результаты представляют собой решение' актуальной научно-технической задачи извлечения закономерностей из фактографических данных смешанного типа. Сформулированные положения и разработанный метод адаптивной кластеризации позволяют автоматизировать процесс выбора метода выполнения кластерного анализа данных в выбранной предметной области, а также повысить эффективность и качество кластеризации за счет интеграции методов кластерного анализа.

Список литературы диссертационного исследования кандидат технических наук Нейский, Иван Михайлович, 2010 год

1. Abonyi J., Roubos J.A., Babuska R., Szeifert F. Modified Gath-Geva Fuzzy Clustering for Identification of Takagi-Sugeno Fuzzy Models. 2002. Источник: www.fint.vein.hu.

2. Abonyi J., Roubos J.A., Oosterom M., Szeifert F. Compact TS-Fuzzy Models through Clustering and OLS plus FIS Model Reduction. 2001. Источник: www.fint.vein.hu.

3. Agrawal R., Gehrke J., Gunopulos D., Raghavan P. Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. 1999. Источник: citeseer.ist.psu.edu.

4. Babuska R. Data-Driven Fuzzy Modeling: Transparency and Complexity Issues. 1999. Источник: www.et.tudelft.nl.

5. Babuska R., Verbruggen H.B., Hellendoorn H. Promising Fuzzy Modeling and Control Methodologies for Industrial Applications. 1999. Источник: www.fuzzytech.com.

6. Boriana L. Milenova, Marcos M. Campos O-Cluster: Scalable Clustering of Large High Dimensional Data Sets. 2002. Источник: asun.ifino.ru.

7. Candillier L., Tellier I., Torre F., Bousquet O. SSC: Statistical Subspace Clustering. 2004. Источник: www.grappa.univ-lille3.fr.

8. Charu C. Aggarwal, Cecilia Procopiuc, Joel L. Wolf, Philip S. Fast Algorithms for Projected Clustering. 1999. Источник: citeseer.ist.psu.edu.

9. Eberkart R., Simpson P., Dobbins R. Computational Intelligence PC Tools. -AP Professional, 1996.

10. Entriken R., Vossner S. Genetic algorithms with cluster analysis for production simulation. 1997. Источник: www.informs-cs.org.

11. Fasulo D. An Analysis Of Recent Work on Clustering Algorithms. 1999. Источник: citeseerx.ist.psu.edu.

12. Frawley W. L., Piatetsky-Shapiro G., Matheus C. J. Knowledge discovery in databases: An overview // AI Magazine. 1992. - № 13(3).

13. Fu Y., Sandhu K., Ming-YiShih A Generalization-Based Approach to Clustering of Web Usage Sessions. 2000. Источник: link.springer.de.

14. Ganti V., Ramakrishnan R., Gehrke J. Clustering Large Datasets in Arbitrary Metric Spaces. 1999. Источник: www.datashaping.com.

15. Guha S., Rastogi R., Shim K. CURE An Efficient Clustering Algorithm for Large Databases. 1998. Источник: citeseer.ist.psu.edu.

16. He H., Singh A. Efficient Algorithms for Mining Significant Substructures in Graphs with Quality Guarantees. Department of Computer Science University of California, Santa Barbara, 2004.

17. Hongxing Li, C.L. Philip Chen, Han-Pang Huang Fuzzy Neural Intelligent Systems. Mathematical Foundation and the Annlications in Engineering. CRC Press LLC, 2001.

18. Hung T. Nguyen, Mukaidono M., KreinovichV. Probability Of Implication Logical Version of Bayes Theorem, and Fuzzy Logic Operations. 2007.

19. Jain A.K., Dubes R.C. Algorithms for clustering data. Prentice-Hall, 1988. Источник: lib.mexmat.ru.

20. Jain A.K., Murty M.N., Flynn P.J. Data Clustering: A Review. Источник: csee.umbc.edu.

21. Jang J., Sun Ch., Mizutani E. Neuro-Fuzzy and Soft Computing. A. Computational Approach to Learning and Machine Intelligence. Prentice-Hall, 1997.

22. Jochheim-Richter A., Hillemann Т., Scharf J., Manns M.P., Ott M. Detection of regulated genes by cluster analysis of serial microarraygene expression data in early murineliver development. 2004.

23. Karypis G., Eui-Hong (Sam) Han, Kumar V. Chameleon: Hierarchical Clustering Using Dynamic Modeling. Journal "Computer", University of Minnesota,

24. Dept. of Computer Science and Eng., vol. 32, no. 8, pp. 68-75, 1999. Источник: www2.computer.org.

25. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? Tandem Computers Inc., 1996.

26. Kogan J., Nicholas C., Teboulle M. Clustering Large and High Dimensional data. Источник: www.csee.umbc.edu.

27. Kosko B. Fuzzy systems as universal approximators. IEEE Transactions on Computers, vol. 43, No. 11 - P. 1329-1333, 1994. Источник: sipi.usc.edu.

28. Kosko B. Optimal Fuzzy Rules Cover Extrema. International Journal of Intelligent Systems, vol. 10, no. 2, pp. 249-255, 1995. Источник: sipi.usc.edu.

29. Krishnapuram R., Joshi A., Yi L. A Fuzzy Relative of the k-Medoids Algorithm 1999. Источник: citeseer.ist.psu.edu.

30. Neel J. Cluster analysis methods for speech recognition. 2005. Источник: www.speech.kth.se.

31. Park J., Han H. Existence and uniqueness theorem for a solution of fuzzy differential equations. Electronic Publishing House, 1996.

32. Parsaye K. A Characterization of Data Mining Technologies and Processes. -DM Review Magazine, no. 11, 1998. Источник: www.dmreview.com.

33. Punj G., Stewart David W. Кластерный анализ в маркетинговых исследованиях: обзор и предпосылки применения. Journal of Marketing Research, Vol. XX, (May 1983), pp.134-148, 1983.

34. STATSOFT Кластерный анализ. Электронный учебник. Источник: www.statsoft.ru.

35. STATSOFT Обобщенные методы кластерного анализа. Электронный учебник. Источник: www.statsoft.ru.

36. Shihab A.I. Fuzzy clustering algorithms and,their application to medical image analysis. 2000. Источник: cism.kingston.ac.uk.

37. Shu-Chuan Chu, John F. Roddick and Jeng-Shyang Pan An Incremental Multi-Centroid, Multi-Run Sampling Scheme for k-medoids-based Algorithms Extended Report. - 2002. Источник: citeseer.ist.psu.edu.

38. Speer N., Merz P., Spieth C., Zell A. Clustering Gene Expression Data with Memetic Algorithms based on Minimum Spanning Trees. University of Tubingen, Center for Bioinformatics. Источник: fs.informatik.uni-tuebingen.de.

39. Spellabs SQL 2005 Data Mining. 2007. Источник: www.spellabs.ru.

40. Spellabs Применение методов интеллектуального анализа данных (Data Mining) в интернет торговле. 2008. Источник: www.spellabs.ru.

41. Sven О. Krumice Algorithmen und Datenstrukturen. Technische Universität Berlin, 2003. Источник: www.zib.de.

42. Tamas F.D., Abonyi J. Trace elements in clinker II. Qualitative identification by fuzzy clustering. - 2002. Источник: www.fint.vein.hu.

43. Vanjukevich O.N., Popov A.A. The F-test by testing of hypotheses about structure variations in the fuzzy regression models. NSTU, 2005. Источник: www.nstu.ru.

44. Wang W. Clustering. COMP 290-90 Research Seminar, Spring 2006.

45. Wright P. Knowledge Discoveiy In Databases: Tools and Techniques. Источник: http://www.acm.org/crossroads/xrds5-2/kdd.html.

46. Zhang Т., Ramakrishnan R., Livny M. BIRCH: An Efficient Data Clustering Method for Very Large Databases. 2006. Источник: citeseer.comp.nus.edu.sg.

47. Абаев JI.4. Выбор вариантов в' нечеткой среде: бинарные отношения и нечеткая декомпозиция. 2006. Источник: www.masters.donntu.edu.ua.

48. Айвазян С.А., Бухштабер В.М., Енюков Е.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989.

49. Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях. Источник: www.plink.ru.

50. Андрейчиков A.B., Андрейчикова О.Н. Анализ, синтез, планирование, решений в экономике. М.: Финансы и статистика, 2000:

51. Андрейчиков A.B., Андрейчикова О.Н. Интеллектуальные информационные системы:.Учебник. М;: Финансы и статистика, 2004.

52. Баргесян A.A., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP, 2-е изд., перераб. и доп. СПб.: БХВ-Петербург, 2008.

53. Бендерская E.H., Жукова C.B. Сравнительный анализ хаотической нейронной сети и нейронной сети Кохонена. 2005.

54. Бендерская E.H., Жукова C.B. Решение задач кластеризации с использованием хаотической нейронной сети. Сборник научных трудов 7-ой всероссийской научно-технической конференции «Нейроинформатика-2005», 4.1. -Москва, с. 54-60, 2005.

55. Бирман Г., Шмидт С. Экономический анализ инвестиционных проектов. М.: Банки и биржи, ЮНИТИ, 1999.

56. Бирюков Е.В., Корнев М.С. Практическая реализация нечеткой нейронной сети при краткосрочном прогнозировании электрической нагрузки. -2005. Источник: library.mephi.ru.

57. Богданов Ю.В., Швандар В.А. Инвестиционный анализ. М.: Юнити, 2000.

58. Борисов А.Н., Алексеев A.B., Крумберг O.A. Модели принятия решений на основе лингвистической переменной. Рига: Зинатне,-1989.

59. Боровиков В.П., Боровиков И.П. STATISTICA. Статистический анализи обработка данных в среде Windows. M.: Филинъ, 1998.

60. Венкатеш Гаити, Иоханнес Герке, Раджу Рамакришнан Добыча данных в сверхбольших базах данных. Открытые системы № 9-10, 1999. Источник: text.marsu.ru.

61. Виттих В. А., Майоров И. В., Скобелев П. О., Сурнин О. JI. Интеллектуальный анализ данных с помощью кластеризации. Источник: www.kg.ru.

62. Вовк О.JI. Иерархический агломеративный алгоритм кластеризации для выделения регионов изображений. 2004. Источник: www.graphicon.ru.

63. Воронцов К.В. Лекции по алгоритмам кластеризации и многомерному шкалированию. 2007. Источник: www.ccas.ru.

64. Галанов В.А. Производные инструменты срочного рынка: фьючерсы, опционы, свопы: Учебник. М.: Финансы и статистика, 2002.

65. Гиляров В.Н, Крюков А.Ю, Бондарчук П.В. Использование Neuro-Fuzzy технологии для генерации и оптимизации эвристических правил программный продукт Лингвогенератор. - 2006. Источник: www.masters. donntu. edu.ua.

66. Гиршов Е. Алгоритмы кластеризации. Источник: logic.pdmi.ras.ru.

67. Гончаров М. Алгоритм Spellabs Regression Clustering. 2005. Источник: www.spellabs.ru.

68. Гончаров М. Кластеризация на основе нечетких отношений. Алгоритм Fuzzy Relation Clastering. 2005. Источник: www.spellabs.ru.

69. Гончаров М. Кластерный анализ. 2008. Источник: www.spellabs.ru.

70. Горшков В. Классификация программных решений. 1998. Источник: www.miracle.ru.

71. Дьяконов В.П., Круглов В.В. MATLAB 6.5 SP1/7/7 SP1/7 SP2 + Simu-link 5/6. Инструменты искусственного интеллекта и биоинформатики. Серия "Библиотека профессионала". М.: СОЛОН-ПРЕСС, 2006.

72. Дюк В. Data Mining состояние проблемы, новые решения. Источник: inftech.webservis.ru.

73. Дюк В.А. Data Mining интеллектуальный анализ данных. Источник: www.olap.ru.

74. Дюк В., Самойленко A. Data Mining: учебный курс. СПб: Изд. Питер, 2001.

75. Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977.

76. Ежов A.A., Шумский С.А. Нейрокомпьютинг и его применения в экономике и бизнесе / Серия "Учебники экономико-аналитического института, МИФИ" под ред. проф. В.В. Харитонова. М.: МИФИ, 1998.

77. Ефимов A.C., Морёнов O.A. Основы нечеткой логики, логико-лингвистические модели. Материалы семинара ITLab, НГУ им. Н.И.Лобачевского, 2004.

78. Жуков Е.Ф. Рынок ценных бумаг: учеб. пособие для вузов. М.: ЮНИ-ТИ-ДАНА, 2002.

79. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: ИМ СО РАН, 1999.

80. Загоруйко Н. Г., Ёлкина В. Н., Лбов Г. С. Алгоритмы обнаружения эмпирических закономерностей. Новосибирск: Наука, 1985.

81. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976.

82. Иванов А.П. Финансовые инвестиции на рынке ценных бумаг. М.: Издательско-торговая корпорация «Дашков и К», 2004.

83. Иванова H.H., Ярушкина Н.Г. Исследование многошагового нечеткого вывода на примере построения экспертной системы оценки экологической безопасности производственной деятельности. 2006. Источник: www.raai.org.

84. Ивахненко А.Г., Юрачковский Ю.П. Моделирование сложных систем по экспериментальным данным. М.: Радио и связь, 1987.

85. Интегрированные модели и мягкие вычисления в искусственном, интеллекте. М.: Наука, 2001.

86. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах. Открытые системы № 4 (24), 1997.

87. Колмогоров И.О. Методы и алгоритмы анализа структуры многомерных данных. 2004. Источник: www.codenet.ru.

88. Кормен Томас X., Лейзерсон Чарльз И., Ривест Рональд JL, Штайн Клиффорд Алгоритмы: построение и анализ, 2-е издание. Пер. с англ. М.: Издательский дом "Вильяме", 2005.

89. Котов А., Красильников И. Кластеризация данных. 2006. Источник: aisystem.narod.ru.

90. Кречетов И. Продукты для интеллектуального анализа данных. Рынок программных средств, N14-15, с.32-39, 1997.

91. Круглов В.В., Дли М.И. Интеллектуальные информационные системы: компьютерная поддержка систем нечеткой логики и нечеткого вывода. М.: Физматлит, 2002.

92. Круглов В., Дли М., Голунов Р. Нечеткая логика и искусственные нейронные сети. 2002.

93. Лагутин М.Б. Наглядная математическая статистика. М.: П-центр, 2003.

94. Мандель И. Д. Кластерный анализ. М.: Финансы и Статистика, 1988.

95. Масалович А. Нечеткая логика в бизнесе и финансах. Источник: www.tora-centre.ru.

96. Министерство образования и науки Кластеризация данных при помощи нечетких отношений в Data Mining. Источник: www.ami.nstu.ru.

97. Миркин Я.М. Ценные бумаги и фондовый рынок. М.: Перспектива, 1995.

98. Мусатов В.Т. Фондовый рынок: Инструменты и механизмы. М.: Международные отношения, 1991.

99. Нейский, И.М. Характеристика технологий и-процессов интеллектуального анализа данных. Интеллектуальные технологии и системы. Сборник учебно-методичёских работ и статей аспирантов и студентов. — М.: Изд-воООО -«Эликс+», 2005. Выпуск 7. - С. 111-122.

100. Нейский, И.М. Классификация и сравнение методов кластеризации. Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. М.: Изд-во ООО "Элике +", 2006. - Выпуск 8.-С. 111-122.

101. Нейский, И.М., Филиппович, А.Ю. Интеграция дивизимных и итерационных методов для адаптивной кластеризации фактографических данных. Труды конференции «Телематика"2009» — М.: 2009. С. 413-414.

102. Нейский И.М. Докластеризация как способ оптимизации времени анализа исходных данных. Научная школа для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)»: тезисы и доклады.-М., 2009.-С. 141-161.

103. Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2004.

104. Паклин Н. Нечеткая логика математические основы. - 2006. Источник: www.basegroup.ru.

105. Паклин Н. Алгоритмы кластеризации на службе Data Mining. 2007. Источник: www.basegroup.ru.

106. Паклин Н. Кластеризация категорийных данных: масштабируемый*алгоритм CLOPE. 2007. Источник: www.basegroup.ru.

107. Пиотровский А.Л., Денисов A.B. Кластерный анализ как инструмент подготовки эффективных маркетинговых решений. Практический маркетинг № 05, 2001.

108. Пустовалова О.С. Искусственные нейронные сети в задачах кластеризации. 2005. Источник: www.usm.md.

109. Романов В.П. Интеллектуальные информационные системы в• экономике: Учебное пособие 7 Под ред. д.э.н., проф: Н:П. Тихомирова. Мл Издательство «Экзамен», 2003.

110. Рукин А. Портфельные инвестиции. Финансово математические методы. - Рынок ценных бумаг, № 18, с. 45-47, 1999.

111. Рутковская Д., Пилиньский М., Рутковский JL Нейронные сети, генетические алгоритмы и нечеткие системы: Пер. с польск. И.Д.Рудинского. М.: Горячая линия - Телеком, 2006.

112. Рухлов А. Принципы портфельного инвестирования. М.: Перспектива, 1997.

113. Рыбаков Г. Построение минимального остовного дерева (алгоритмы Крускала, Прима, Борувки). 2005. Источник: rain.ifino.ru.

114. Соловьев В.Д. Кластерный анализ многофакторных лингвистических понятий. Материалы международной конференции «Диалог», 2000.

115. Стариков А. Использование самоорганизующихся карт в задачах кластеризации. 2006. Источник: www.basegroup.ru.

116. Стариков А. Самоорганизующиеся карты Кохонена математический аппарат. - 2006. Источник: www.basegroup.ru.

117. Столяров JI.H. Введение в теорию дискретного прецедентного анализа динамических систем. 1998. Источник: www.sinc.ru.

118. Тельнов Ю.Ф.4 Интеллектуальные информационные системы в экономике. Учебное пособие. Издание третье, расширенное и доработанное. Серия «Экономика и бизнес». -М.: СИНТЕГ, 2002.

119. Трухачёв A.A. Кластеризация и-визуализация информации с помощьюнейронных сетей. 2003. Источник: www.library.mephi.ru.

120. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. Перевод на русский язык, Ю. А. Зуев, В. А. Точенов, 1992.

121. Федотов А. Реализация системы нечеткого вывода. 1999.

122. Хайкин С. Нейронные сети: полный курс, 2-е издание.: Пер. с англ. -М.: Издательский дом «Вильяме», 2006.

123. Царегородцев ВТ. Масштабируемые алгоритмы кластерного анализа: назад в будущее? 2006. Источник: www.neuropro-.ru.

124. Царегородцев В.Г. Пригодность карт Кохонена для визуализации и разведочного анализа данных. 2006. Источник: www.neuropro.ru.

125. Чубукова И.A. Data Mining: Учебное пособие. М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2006.

126. Шиляева Т.Ю., Ищенко И.П., Кулик Г.М., Пономарев Э.Б. Исследование возможностей личностной типизации средствами факторного и кластерного анализа. Источник: www.kurgan-city.ru.

127. Шишлянникова Л.М. Математическое сопровождение научной работы с помощью статистического пакета SPSS for Windows 11.5.0 // Учебно-методическое пособие. М.: МГППУ, 2005. Источник: matlab.mgppu.ru.

128. Штовба С. Д. Введение в теорию нечетких множеств и нечеткую логику. Источник: matlab.exponenta.ru.

129. Щавелёв Л. В. Способы аналитической обработки данных для поддержки принятия решений. Журнал "СУБД", 1998, №4-5.

130. Щавелёв Л. В., Коровкин С. Д., Левенец И. А. Агрегация и интеллектуальный анализ информации Хранилищ Данных. Новые информационные технологии: материалы науч.-практ. семинара / Моск. гос. ин-т электроники и математики. - М., 1998.

131. Ярушкина Н.Г. Основы теории нечетких и гибридных систем. М.: Финансы и статистика, 2004.

132. Ярушкина Н.Г. Гибридные системы, основанные на мягких вычислениях: определения, архитектура, возможности. Программные продукты и системы, № 3, 2002.

133. Яхъяева Г. Э. Нечеткие множества и нейронные сети: Учебное пособие. М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2006.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.