Технология структуризации информационных массивов взаимосвязанных объектов тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Шоргин, Всеволод Сергеевич

  • Шоргин, Всеволод Сергеевич
  • кандидат технических науккандидат технических наук
  • 2005, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 227
Шоргин, Всеволод Сергеевич. Технология структуризации информационных массивов взаимосвязанных объектов: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2005. 227 с.

Оглавление диссертации кандидат технических наук Шоргин, Всеволод Сергеевич

Содержание.

Список сокращений.

Введение.

1 ПОСТАНОВКА ЗАДАЧИ СТРУКТУРИЗАЦИИ ИНФОРМАЦИОННЫХ МАССИВОВ ВЗАИМОСВЯЗАННЫХ ОБЪЕКТОВ И ЕЕ МЕСТО СРЕДИ ЗАДАЧ АНАЛИЗА ДАННЫХ.

1.1 Задачи интеллектуального анализа данных.

1.2 Содержательная постановка задачи структуризации информационных массивов взаимосвязанных объектов. Примеры реальных постановок.

1.3 Задача структуризации информационных массивов взаимосвязанных объектов как одна из задач исследования структуры данных в ИАД.

1.4 Системы управления базами данных как инструментарий технологий структуризации.

Правила реляционных СУБД.

1.5 Цель и задачи диссертации.

1.6 Модель информационных структур для задачи структуризации. Математическая постановка типовой задачи.

1.7 Выводы по разделу 1.

2 ЗАДАЧА СТРУКТУРИЗАЦИИ БОЛЬШИХ БИЗНЕС-ГРУПП. АНАЛИЗ НОРМАТИВНОЙ БАЗЫ И МОДЕЛЬ ИНФОРМАЦИОННЫХ СТРУКТУР.

2.1 Общая характеристика задачи.

2.2 Объект исследования и анализ нормативной базы.

2.3 Математическая модель информационных структур и постановка задач структуризации бизнес-групп.

2.4 Выводы по разделу 2.

3 ЗАДАЧА СТРУКТУРИЗАЦИИ БОЛЬШИХ БИЗНЕС-ГРУПП. ОПИСАНИЕ ПРОГРАММНОГО КОМПЛЕКСА «КОРПОРАТИВНЫЕ ОТНОШЕНИЯ».

3.1 Структура программного комплекса.

3.2 База данных по физическим и юридическим лицам.

3.3 Общие сведения об алгоритмах и технологии реализации расчетных модулей.

3.4 Алгоритмы выявления групп лиц.

3.5 Алгоритмы выявления аффилированности.

3.6 Алгоритмы определения контроля.

3.7 Алгоритм выявления лиц, входящих в ИБГ, с вычислением степени их принадлежности.

3.8 Пользовательский интерфейс для просмотра и редактирования данных, управления расчетами в программном комплексе «Корпоративные отношения»

3.9 Технология визуального формирования многокритериальных запросов сложной структуры к БД.

3.10. Выводы по разделу 3.

4 ЗАДАЧА СТРУКТУРИЗАЦИИ ИНФОРМАЦИОННЫХ МАССИВОВ В АСУР.

4.1 Вводные замечания.

4.2 Общая характеристика АСУР.

4.3 Комплекс программ экспорта и импорта данных БД АСУР.

4.4 Задача выявления скрытых взаимосвязей в среде объектов учета на уровне ЦП АСУР.

4.5 Утилита «Построитель запросов».

4.6. Выводы по разделу 4.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Технология структуризации информационных массивов взаимосвязанных объектов»

Многие научные исследования и прикладные разработки приводят к постановке задачи выяснения «скрытых» («неявных») связей или отношений между объектами в рамках некоторой предметной области на основе имеющейся информации о «явных» связях между объектами, в том числе выражаемых качественно и количественно. Так, в настоящее время четко обозначились многочисленные прикладные задачи, приводящие к проблемам выявления «неявных» связей или отношений внутри структур и между структурами (холдинги, корпорации, другие формальные и неформальные группы юридических и физических лиц, те или иные технические объекты и системы, и т.п.). Установление таких связей особенно важно с прикладной точки зрения (технологической, правовой, юридической, финансовой и т.п.). Исходные данные о «явных связях» при этом требуется предварительно формализовать надлежащим образом, чтобы свести к логическим или численным переменным. Тем самым осуществляется формализация исходных данных («явных связей»). По совокупности этих переменных и должны быть вычислены отношения связи, свойства, структура рассматриваемого множества объектов («неявные связи»). В результате выявляются те или иные группы (кластеры) внутри рассматриваемого множества объектов и их иерархия. Каждый кластер показывает одну грань явления; взаимный анализ различных кластеров дает возможность определить приоритеты, предпочтения, те или иные рекомендации или необходимые технические решения, юридические выводы и т.п.

Тем самым всё более актуальной становится задача разработки методов и средств анализа информационных массивов большой размерности, характеризующих те или иные взаимосвязанные объекты, с целью выявления внутренних системных, априори неизвестных взаимосвязей между объектами таких массивов. Задача структуризации (определения внутренней структуры такого массива) должна решаться как с точки зрения выявления «вертикальных» отношений внутри таких массивов (именуемых в разных предметных областях отношениями влияния, предпочтения, руководства, логического следования, использования, включения, цитирования и т.п.), так и с точки зрения выявления «горизонтальных» отношений взаимодействия (связи, родства, союза, близости по тематике и т.п.) на основе имеющейся информации о «явных», априори заданных взаимосвязях между этими объектами. Выявление «вертикальных» отношений назовем задачей стратификации анализируемого массива; выявление «горизонтальных» отношений назовем задачей кластеризации анализируемого массива.

В частности, необходимость в разработке методов и средств такого рода возникла при решении задач анализа структурных корпоративных отношений в больших бизнес-группах (холдингах) и задач структуризации информационных объектов (выявления скрытых взаимосвязей в среде объектов учета) в Системе учета наличия, движения и качественного состояния технических и программных средств Информационно-телекоммуникационной системы (ИТС) Банка России - автоматизированной системе учета ресурсов (АСУР), а также в ряде других предметных областей

Такого рода задачи можно отнести к классу задач интеллектуального анализа данных (английский термин - Data Mining). Интеллектуальный анализ данных (ИАД), согласно определению одного из ведущих мировых специалистов в этой области, Г.Пятецкого-Шапиро [90] - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Данной тематике посвящены многочисленные работы таких специалистов, как Н.Г.Загоруйко [26], АЛ.Самойленко, В.А.Дюк [23], А.А.Барсегян, М.С.Куприянов, В.В.Степаненко, И.И.Холод [11], R.S.Michalski, R.Stepp [86], Jiawei Han,

M.Kamber [80], D.Hand, Heikki Mannila, P.Smyth [81], Ian H. Witten, Eibe Frank [97] и др.

Одним из важнейших типов знаний, извлекаемых с помощью методов НАД, являются определенные правила, закономерности, связывающие свойства объектов предметной области. В основу ИАД положена идея «шаблонов» (концептов), отражающих закономерности, свойственные подвыборкам данных. Чтобы сделать сложные результаты прозрачными, в ИАД рекомендуется использовать широкий набор вспомогательных средств в виде простых для понимания заготовок (моделей, концептов).

Приведенное выше определение ИАД является весьма общим и охватывает широчайшее множество задач и методов. В частности, значительное число постановок, результатов и технологий данной области относится к ситуациям, когда исходные данные неформализованы или неструктурированы (или формализованы или структурированы частично), а выявляемые закономерности априори неясны. Важность этих постановок и соответствующих разработок трудно переоценить. В то же время известные отечественные специалисты в области ИАД В.А.Дюк и А.П.Самойленко отмечают в книге [23], что среди «мифов» относительно возможностей ИАД имеется следующий: «средства интеллектуальной обработки данных автоматически обнаруживают различные закономерности». На самом деле, как отмечается в этой книге, хотя многие средства такой обработки действительно позволяют в ряде ситуаций автоматически выявлять закономерности в исследуемых данных, тем не менее, ставить им конкретные цели необходимо, а в ряде предметных областей не удается получить сколь-нибудь осмысленных и практически важных результатов без задания упоминавшихся типовых шаблонов для группировки объектов и т.п.

Одним из важных специальных направлений ИАД является постановка и решение новых задачи в области выявления взаимосвязей, относящихся к априори заданным типам, для предметных областей, в которых исходные данные уже по некоторым признакам упорядочены. В частности, к этому классу задач относится рассматриваемая в данной диссертации проблема структуризации по заданным шаблонам массивов взаимосвязанных объектов, информация о которых (прежде всего информация о «явных» взаимных связях) задана. Задача разработки технологии структуризации больших информационных массивов взаимосвязанных объектов является весьма актуальной и в таком виде до настоящего времени не ставилась.

Цель и задачи работы. Целью диссертации является разработка технологии структуризации больших информационных массивов на основе имеющейся информации о взаимных связях элементов массивов.

Для достижения этой цели ставятся следующие задачи:

• формулировка проблемы структуризации больших массивов взаимосвязанных объектов как задачи определения неявных связей по заданным явным связям на основе определенных решающих правил;

• разработка модели информационных процессов и структур в рамках задачи структуризации больших массивов взаимосвязанных объектов, ее представление в виде формальной постановки типовой задачи структуризации больших массивов, математического описания характеристик и решающих правил;

• разработка технологии и специального программного обеспечения стратификации и кластеризации для задачи анализа структурных корпоративных отношений, рассматриваемой в качестве представительного варианта общей проблемы;

• разработка технологии и специального программного обеспечения для решения задачи анализа отношений использования оборудования в АСУР.

• разработка программных средств для импорта и экспорта данных и для построения многокритериальных запросов в интересах обеспечения оперативного решения задач структуризации

Методы исследования. В работе использованы методы теории графов, системного анализа, теоретической и прикладной информатики.

Научная новизна диссертации определяется результатами, впервые полученными в данной работе, и заключается в следующем.

1) Впервые сформулирована задача разработки технологии структуризации больших информационных массивов взаимосвязанных объектов - определения неявных связей по заданным явным связям на основе определенных решающих правил.

2) Впервые разработана модель информационных структур и осуществлена формализация постановки типовой задачи структуризации в рамках проблематики структуризации больших массивов взаимосвязанных объектов;

3) Впервые исследована нормативная база для анализа структурных корпоративных отношений; на основе этого анализа разработана модель информационных структур и осуществлена формализация постановки задачи структуризации больших бизнес-групп.

4) В качестве представительного варианта общей проблемы впервые разработана и реализована информационная технология стратификации и кластеризации для задачи анализа структурных корпоративных отношений.

Практическая ценность работы состоит в том, что она является основой для создания современных информационных технологий структуризации больших массивов взаимосвязанных объектов. Реализация результатов работы:

• на основе результатов диссертации разработан программный комплекс «Корпоративные отношения», внедренный в Металлургической страховой компании, Российском Центре поддержки конкуренции.

• основные принципы разработанной технологии применены для решения прикладной задачи анализа отношений использования оборудования в

АСУР; разработано специальное алгоритмическое и программное обеспечение для решения задач анализа отношений использования оборудования в АСУР Банка России.

Апробация результатов. Материалы диссертации докладывались и обсуждались на следующих международных и всероссийских конференциях и научных форумах.

1) Всероссийская конференция «Экономическая наука современной России» (Москва, ноябрь 2000 г.)

2) I Научная сессия Института проблем информатики РАН (Москва, апрель 2001 г.)

3) VII Международная конференция «Информационные сети, системы и технологии» (ICINASTe-2001) (Минск, октябрь 2001)

4) IV Всероссийский симпозиум по прикладной и промышленной математике (осенняя сессия) (Сочи, октябрь 2003 г.)

5) II Научная сессия Института проблем информатики РАН (Москва, апрель 2005 г.) а также научных семинарах в МГУ им. М.В.Ломоносова, РЭА им. Г.В.Плеханова, МСЦ РАН, ИЛИ РАН.

Публикации. По теме диссертации опубликовано 11 печатных работ, список которых приведен в конце реферата.

Кроме того, по теме диссертации выпущено 4 научно-технических отчета в ИЛИ РАН и более 20 томов документации на Систему учета наличия, движения и качественного состояния технических и программных средств ИТС Банка России - АСУР.

Структура диссертации.

Диссертация состоит из введения, четырех разделов, заключения, списка литературы и одного приложения.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Шоргин, Всеволод Сергеевич

Основные результаты диссертации

1. Осуществлена постановка задачи структуризации больших информационных массивов взаимосвязанных объектов - определения неявных связей по заданным явным связям на основе определенных решающих правил.

2. Разработана модель информационных структур - математическая формализация постановки типовой задачи структуризации для проблематики структуризации больших массивов взаимосвязанных объектов.

3. Разработаны информационная технология и специальное программное обеспечение стратификации и кластеризации для задачи анализа структурных корпоративных отношений (Программный комплекс «Корпоративные отношения»),

4. Разработаны информационная технология и специальное программное обеспечение для решения задачи анализа отношений использования оборудования в Системе учета наличия, движения и качественного состояния технических и программных средств ИТС Банка России (АСУР).

5. Разработан комплекс программ импорта и экспорта данных БД АСУР.

6. Разработаны информационная технология визуального формирования многокритериальных запросов сложной структуры к БД и программа «Построитель запросов» - универсальный инструмент формирования многокритериальных запросов для обеспечения оперативного решения задач структуризации, используемый как в Программном комплексе «Корпоративные отношения», так и в БД АСУР.

ЗАКЛЮЧЕНИЕ.

Список литературы диссертационного исследования кандидат технических наук Шоргин, Всеволод Сергеевич, 2005 год

1., Дементьев В. Акционерные и неимущественные механизмы интеграции в российских бизнес-группах.//Российский экономический журнал. — 2000. — № 1. — С. 14.

2. Авдашева С.Б., Балюкевич В.П., Горбачев А.В., Дементьев В.Е., Паппэ Я.Ш. Анализ роли интегрированных структур на российских товарных рынках. М. Бюро экономического анализа, 2000.

3. Айвазян С.А., Бухштабер В.М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности.- М.: Финансы и статистика, 1989. 607 с.

4. Айвазян С.А., Степанов B.C. Программное обеспечение по статистическому анализу данных: методология сравнительного анализа и выборочный обзор рынка. http://www.cemi.rssi.ru/rus/publicat/e-pubs/ep97001/toc.htm.

5. Аркадьев А.Г., Браверманн Э.М. Обучение машины классификации объектов. М.: Физматгиз, 1963.

6. АСУР. Общее описание системы учета наличия, движения и качественного состояния технических и программных средств ИТС Банка России (СЕПБ.466452.001 ТО).

7. АСУР. Руководство администратора региональной подсистемы учета наличия, движения и качественного состояния технических и программных средств ИТС Банка России (СЕПБ.466452.001 Д4).

8. АСУР. Руководство оператора ввода данных региональной подсистемы учета наличия, движения и качественного состояния технических и программных средств ИТС Банка России (СЕПБ.466452.001 Д5).

9. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. -М.: Мир, 1982.

10. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. БХВ-Петербург, 2004.

11. Дынкин А.А. Есть ли у России шанс в глобальной экономике? Библиотека публикаций Московского Центра Карнеги. Том 7, весна 2002 -Россия в мировой экономике. http://pubs.camegie.ru/p&c/Vol7-2002/2/default.asp?n=03ad.asp

12. Беляева И.Ю. Интеграция корпоративного капитала и формирование финансово-промышленной элиты: Российский опыт. — М.: Финансовая академия при Правительстве РФ, 1999. — С. 156.

13. Бэстенс Д.Э., Ван Ден Берг В.-М., Вуд Д. Нейронные сети и финансовые рынки. М.: ТВП, 1997, 236 с.

14. Вороновкий Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности -X.: ОСНОВА, 1997. 112 с. ВМПС

15. Гуд И.Дж. Ботриология ботриологии. В кн.: Классификация и кластер. Ред. Дж.Вэн Райзин. М.: «Мир», 1989, с.66-821.

16. Гуриев Сергей, Лазарева Ольга, Рачинский Андрей, Цухло Сергей. Корпоративное управление в российской промышленности. Библиотека публикаций Московского Центра Карнеги. РАБОЧИЕ МАТЕРИАЛЫ, 2003, вып.З www.carnegie.ru/en/pubs/workpapersAVP-2004-10-www.pdf.

17. Драчева Е.Л., Либман A.M. Проблемы глобализации и интеграции международного бизнеса.//Менеджмент в России и за рубежом. — 2000. — № 4.

18. Драчева Е.Л., Либман A.M. Формирование системы внутренних рынков транснациональных корпораций и место России в этом процессе.//Менеджмент в России и за рубежом. — 2000. — № 6.

19. Драчева Е.Л., Либман A.M. Проблемы определения и классификации интегрированных корпоративных структур. Менеджмент в России и за рубежом, №4 2001.

20. Дынкин А.А., Соколов А. А. Интегрированные бизнес-группы в российской экономике / Вопросы экономики, № 4, 2002.

21. Дынкин А.А., Соколов А.А. Интегрированные бизнес-группы -прорыв к модернизации страны. М.: Центр исследования и статистики науки, 2001.

22. Дюк В.А., Самойленко А.П. Data Mining: учебный курс. ИД "Питер",2001.

23. Дягилева А.В., Киселев С.Л, Сомин Н.В. Статистическая модель рубрикации текстов на примере сообщений СМИ. // Дистанционное образование, 1998. N7. - С. 16-21.

24. Енюков И.С. Методы, алгоритмы, программы многомерного статистического анализа. М.: Финансы и статистика, 1986.

25. Загоруйко Н.Г. Прикладные методы анализа данных и знаний, Новосибирск, изд-во Института математики, 1999 270 с.

26. Зайцев Б.Ф., Агурбаш Н.Г., Ковалева Н.Н., Малютина О.И. Механизмы создания региональных финансово-промышленных групп. — М.: Экзамен, 2001. —С. 27.

27. Закон РФ о конкуренции и ограничении монополистической деятельности на товарных рынках в редакции Федерального закона от 06.05.98 N 70-ФЗ // http://antimonopol.centro.ru/docs/zakon.htm.

28. Кендэлл М., Стюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. - 736 с.

29. Киселев М., Соломатии Е. Средства добычи знаний в бизнесе и финансах. Открытые системы, 1997, №4, с.41-44.

30. Кривенко М.П. Сравнительный анализ результатов различных классификаций совокупности одних и тех же объектов. В сб. «Системы и средства информатики», 2003, Вып.13, с. 361-381.

31. Кривенко М.П., Васильев В.Г. Кластерный анализ и массивов текстовых данных. М.: ИЛИ РАН, 2004 - 189 с.

32. Кривенко М.П., Васильев В.Г. Применение методов кластерного анализа и многомерного шкалирования для автоматического построения рубрик. В сб. «Системы и средства информатики», 2002, Специальный выпуск, с. 142-159.

33. Крускал Дж. Взаимосвязь между многомерным шкалированием и кластер-анализом. В кн.: Классификация и кластер. Ред. Дж.Вэн Райзин. М.: «Мир», 1989, с.20-41.

34. Кузнецов И.П. Методы обработки сводок с выделением особенностей фигурантов и происшествий. Труды международного семинара Диалог-1999 по компьютерной лингвистике и ее приложениям. Том 2. Таруса 1999.

35. Кузнецов И.П. Семантические представления. М. Наука. 1986г. 290 с.

36. Ллойд Э., Уледерман, Тюрин Ю.Н. (ред). Справочник по прикладной статистике. В 2-хт.-М.: Финансы и статистика, 1989, 1990.

37. Лукашевич Н.В. Автоматическое рубрицирование потоков текстов по общественно-политической тематике. // НТИ. Сер. 2. 1996. - N10. - С. 22-30.

38. Макаров А.А., Тюрин Ю.Н. Анализ данных на компьютере (3-е издание, под ред. Фигурнова В.Э.). М.: "Инфра-М", 2003 г. - 544 с.

39. Матула Д.В. Методы теории графов в алгоритмах кластер-анализа. В кн.: Классификация и кластер. Ред. Дж.Вэн Райзин. М.: «Мир», 1989, с.83-111.

40. Мейер Д. Теория реляционных баз данных. М.:Мир, 1987. - 608 с.

41. Нормативные акты Федеральной комиссии по рынку ценных бумаг, 1995-99 гг. // http://antimonopol.centro.ru/docs/zakon.htm.

42. Паппэ Я.Ш. Олигархи: Экономическая хроника, 1992 2000. - М.: ГУ-ВШЭ 2001.

43. Полухин А.Н., Чавтараев Р.Б. Компонентный подход к построению системы автоматизации деятельности предприятия // Системы и средства информатики. Вып. 10 -М.: Наука. Физматлит, 2000 стр. 91-100.

44. Пройдаков Э. Что такое Data Mining? PC Week, 1999, №26.

45. Сокал P.P. Кластер-анализ и классификация: предпосылки и основные направления. В кн.: Классификация и кластер. Ред. Дж.Вэн Райзин. М.: «Мир», 1989, с.7-19.

46. Соловьева Н.С., Сомин Н.В. Лексико-статистический метод рубрицирования: обсуждение и эксперименты. // Системы и средства информатики. Вып. 10. М.: Наука. 2000. - С. 205-215.

47. Соловьева Н.С., Сомин Н.В. Рубрицирование текстов как информационная технология // Системы и средства информатики. Вып. 11, -М.: Наука, 2001. с. 195-201.

48. Сомин Н.В., Соловьева Н.С., Соловьев С.В. Система рубрикации текстовых сообщений. //Труды Междунар. семинара Диалог'98 по компьютерной лингвистике и ее приложениям: В 2 т. Т. 2./Под ред. А.С. Нариньяни. Казань: ООО "Хэтер", 1998. - С. 574-581.

49. Уоссермен Ф. Нейрокомпьютерная техника. Теория и практика, М.,Мир, 1992.

50. Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989-215 с.

51. Федчук В. Холдинг: эволюция, сущность, понятие//Хозяйство и право. — 1996. —№ 12.

52. Фейнман Р. Природа физических законов. М.: Мир, 1967.

53. Хартиган Дж.А. Задачи, связанные с функциями распределения в кластер-анализе. В кн.: Классификация и кластер. Ред. Дж.Вэн Райзин. М.: «Мир», 1989, с.42-65.

54. Хартман Г. Современный факторный анализ. — М.: Статистика, 1972.

55. Шемакин Ю.И. Машинный поиск и сортировка информации. М., МИНХ им. Г.В.Плеханова, 1983 166 с.

56. Шемакин Ю.И. Основы информатики и вычислительной лингвистики. М., МИНХ им. Г.В.Плеханова, 1983 224 с.

57. Шемакин Ю.И. Семантика самоорганизующихся систем. М., Академический проект, 2003 176 с.

58. Шемакин Ю.И., Романов А.А. Компьютерная семантика. М., Научно-образовательный центр «Школа Китайгородской», 1995 344 с.

59. Эскиндаров М.А. Развитие корпоративных отношений в современной российской экономике. — М.: Республика, 1999.

60. Синицын И.Н., Шоргин B.C. Информационная технология автоматизированного выявления аффилированных лиц и ее программная реализация // Системы и средства информатики. М.: Наука. - 2003. - Вып.13. -С. 251-263. ш-7

61. Сурков С.Н., Шоргин С .Я., Шоргин B.C. О программном комплексе поиска групп лиц. // Вестник Министерства Российской Федерации по антимонопольной политике и поддержке предпринимательства. 1999. - №2-3. - С.29-35. ш-1

62. Шоргин B.C. Задачи и средства выявления групп лиц и аффилированности в интегрированных бизнес-группах // VII Международная конференция "Информационные сети, системы и технологии". Труды. Минск: БГЭУ. 2001 -Т.2 - С. 241-246. ш-4

63. Шоргин B.C. Информационная технология автоматизированного выявления групп лиц и аффилированных лиц в бизнес-группах. // Вестник Российского университета дружбы народов, сер. Прикладная математика и информатика. 2003.-№1 - С. 162-168. ш-8

64. Шоргин B.C. Информационная технология быстрого автоматизированного выявления взаимосвязей в интегрированных бизнес-группах// Наукоемкие технологии. 2004. Т.5. Вып.7. С. 83-87. ш-9

65. Шоргин B.C. Реализация информационной технологии автоматизированного выявления групп лиц и аффилированных лиц // IV

66. Всероссийский симпозиум по прикладной и промышленной математике. Тезисы докладов, часть I. // Обозрение прикладной и промышленной математики. 2003. - Т.10. - Вып.2. - С. 435-436. ш-5

67. Шоргин B.C. Проблемы структуризации информационных массивов взаимосвязанных объектов // Проблемы и методы информатики. II Научная сессия ИЛИ РАН: Тезисы докладов -М.: ИЛИ РАН, 2005. С. 168-171. ш-11

68. Bishop С.М. Svensen М., Williams C.K.I. GTM: The Generative Topographic Mapping // Technical Report NCRG/96/015. 1997. - 16 p. (www.ncrg.aston.ac.uk).

69. Codd E.F. A Relational Model of Data for Large Shared Data Banks. CACM 13: 6, June 1970.

70. Codd E.F. Is your DBMS really relational? Computer World, October 14,1985.

71. Cutting D.R., Rarger D.R., Pedersen J.O., Tukey J.W. Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections // SIGIR'92, 1992.-p.318-329.

72. Fischer D., Langley P. Approaches to conceptual clustering, Proc. 9th IJCAI, Los Angeles, 1985, pp.691-697.

73. Gotthard Willi, Marwick Alan and Seiffert Roland. Mining Text Data. http://www.db2mag.com/dbarea/archives/1997/q4/97wiGot.shtml.

74. Han Jiawei, Kamber Micheline. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, 2000.

75. Hand David, Mannila Heikki, Smyth Padhraic. Principles of Data Mining. MIT Press, 2001.

76. Kaski S., Honkela Т., Lagus K., Kohonen T. Creating an order in Digi tal Libraries with Self-Organazing Maps.// Proc WCNN'96. 1996. P.814--817.

77. Kies P., Michalewich Z. Podstawy algorytmow genetycznych, Matematyka Stosowana, 2000, No. 1(42), S.68-91.

78. Kuznetsov Igor FASTUS:a Cascaded Finite-State Trasducerfor Extracting Information from Natural-Language Text. AIC, SRI International. Menlo Park. California, 1996.

79. Kuznetsov Igor, Matskevich Andrey. System for Extracting Semantic Information from Natural Language Text. Труды международного семинара Диалог-2002 по компьютерной лингвистике и ее приложениям. Том 2. Протвино, Наука, 2002.

80. Michalski R.S., Bratko I., Kubat M. Machine Learning and Data Mining Methods and Applications. N.Y.: John Wiley & Sons, 1998.

81. Michalski R.S., Stepp R. Learning from Observation: Conceptual Clustering // Machine Learning: An artificial intelligence approach. Morgan Cauffman, 1983.

82. Ossowski A., Swecicka A. Statistical Genetic Algorithms, Intelligent Information Systems 2001, Proc. Int. Symp. " Intelligent Information Systems X", Springer-Verlag, 2001, P.155-166.

83. PCWeek/RE, №42, ноябрь 2004, c.6 «Военные известия».

84. Piatetsky-Shapiro Gregory and Frawley William, eds., Knowledge Discovery in Databases, AAAI/MIT Press, 1991.

85. Shepard R.N. Representation of structures in Similarities: Problems and Prospects, Paychometrica 39, p.373-421.

86. Spirtes P., Glymour C., Scheines R. Causation , Prediction and Search, Lecture Notes in Statistics 81, Springer-Verlag, 1993.

87. Steele R.D. On Intelligence/ Spies and Secrecy in an Open World. AFCEA International Press, Fairfax, Virginia, 2000 495 p.

88. Strategic Investment Plan for Intelligence Community Analysis. http://www.cia.gov/cia/reports/unclasssip.

89. Sullivan D. Document Warehousing and Text Mining, Wiley, Paperback, 2001 -542 p.

90. Tipping M.E., Lowe D. Shadow Targets; A Novel Algorithm for Topographic Projecting by Radial Basic Functions // Neural Computing Research Group, Birmingham: Aston Uneversity, 1997. - 6 p.

91. Wiedermann J. Searching Algorithms, Teubner, Leipzig, 1987.

92. Witten Ian H., Frank Eibe. Data Mining. Academic Press, 2000.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.