Методы интеллектуального анализа данных в предметных областях с частично детерминированными свойствами объектов тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Григорьев, Петр Александрович

  • Григорьев, Петр Александрович
  • кандидат технических науккандидат технических наук
  • 2000, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 148
Григорьев, Петр Александрович. Методы интеллектуального анализа данных в предметных областях с частично детерминированными свойствами объектов: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2000. 148 с.

Оглавление диссертации кандидат технических наук Григорьев, Петр Александрович

Введение.

Глава 1. JSM-метод, как средство интеллектуального анализа данных.,.

1. Интеллектуальный анализ данных.

1.1. Определение ИАД.

1.2. Знания в ИАД.

1.3. Данные в ИАД.

1.4. Неформальная классификация методов ИАД.

2. JSM-метод автоматического порождения гипотез.

2.1. Истинностные значения JSM-логики.

2.2. Переменные в JSM-логике: объекты, фрагменты, свойства.

2.3. Внутренние предикаты JSM-логики.

2.5. Каузоидные структуры.

2.6. Язык JSM-логики.

2.7. Правила вывода JSM-метода.

2.8. Алгоритмические средства JSM-метода.

Глава 2 Количественный JSM-метод.

1. Предметные области с частично детерминированными свойствами объектов.

2. Аргументация обще-импликативных гипотез.

3. Количественные критерии фальсификации JSM-гипотез.

4. Система правил вывода количественного JSM-метода.

5. Алгоритмические средства количественного JSM-метода.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы интеллектуального анализа данных в предметных областях с частично детерминированными свойствами объектов»

За последнее время технические возможности для сбора и хранения больших массивов данных значительно возросли. Накоплены миллионы (!) баз данных [51], которые охватывают практически все области человеческого знания. Такой стремительный рост накапливаемых данных вызывает острую необходимость в средствах Интеллектуального анализа данных (Р1АД), которые позволяют автоматически извлекать из больших массивов данных практически полезные знания [65].

В течение последних лет методы ИАД стремительно развивались. Столь же стремительно разрабатывались профаммные средства ИАД, и расширялась область их применения. В предметных областях, где предполагается достаточно жесткий детерминизм, хорошо зарекомендовал себя один из наиболее перспективных методов ИАД - Т8М-метод автоматического порождения гипотез [1, 3, 4, 6-10,13, 23-27, 31, 34, 35, 38-43, 48, 49]. В областях, где превалируют случайные события, успешно работают методы мягких вычислений [73], статистические методы [15, 57]. Однако для обширного класса задач - задач ИАД в предметных областях, где причинно-следственные закономерности сосуществуют со случайными событиями, применение как 18М-метода, так и других известных методов ИАД оказывается недостаточно эффективным. гр u u u

Таким образом, чрезвычайно актуальной задачей является создание методов ИАД, эффективных для работы в предметных областях с частично детерминированными свойствами объектов.

Целью настоящей работы является разработка логико-алгоритмического аппарата, обеспечивающего эффективное решение задач ИАД в предметных областях с частично детерминированными свойствами объектов.

Для достижения поставленной цели необходимо:

1. Изучить возможности существующих методов ИАД для работы в предметных областях с частично детерминированными свойствами объектов.

2. Разработать систему правил правдоподобного вывода для порождения и проверки гипотез о зависимостях, допускающих исключения, то есть зависимостях, присущих предметным областям с частично детерминированными свойствами объектов.

3. Построить алгоритмический аппарат, реализующий автоматический вывод в предложенной системе правил.

4. Продемонстрировать эффективность предложенного метода для решения задач ИАД в нескольких конкретных предметных областях на основе соответствующих программных реализаций.

На основе анализа современных методов НАД в целом, а также углубленного исследования 18М-метода с одной стороны, и изучения специфики предметных областей с частично детерминированными свойствами объектов - с другой, в диссертационной работе разрабатывается оригинальный метод НАД - количественный 18М-метод. Ядром метода является предлагаемая система правил правдоподобного вывода, формализующая 18М-рассуждение, обогащенное количественными критериями проверки гипотез. При построении алгоритмического аппарата, реализующего автоматический вывод в предложенной системе правил, учитываются соображения эффективной вычислимости. Количественный 18М-метод - основной теоретический результат работы, выносимый на защиту.

Программные системы, реализующие предложенный метод, внедрены в разнородных прикладных областях: медицине, прикладном сетевом обеспечении, социологии. Анализ опыта внедрения количественного 18М-метода демонстрирует его высокую эффективность для решения задач прогнозирования, распознавания, восстановления данных, что характеризует практическую значимость работы.

Апробация работы. Результаты работы докладывались на международных конференциях НТИ-97 и НТИ-99, а также на научном семинаре Отдела теоретических и прикладных проблем информатики Всероссийского института научной и технической информации (ВИНИТИ). Основные результаты диссертации опубликованы в ряде статей [18, 19, 21, 22 .

Са?рука?ура работы

Работа состоит из введения, трех глав и заключения.

В первой главе приводится определение ИАД как процесса извлечения знаний из данных. Рассматриваются виды знаний и способы представления данных в задачах Р1АД. Предлагается неформальная классификация методов ИАД. Подробно разбирается один из наиболее универсальных методов ИАД - 18М-метод автоматического порождения гипотез.

Основной теоретический результат настоящей работы -количественный 18М-метод - излагается во второй главе. Прежде всего, уточняется область применения количественного 18М-метода. Затем предлагается формализация интуитивного понятия аргументации гипотез, исходя из которой, формулируются количественные критерии фальсификации 18М-гипотез. Формулируются правила правдоподобного вывода, задействующие предложенные критерии. Предлагаются алгоритмические решения, реализующие количественный 18М-метод.

Третья глава посвящена результатам применения количественного 18М-метода в конкретных задачах ИАД. Рассматриваются три направления применения метода: распознавание свойств объектов, прогнозирование свойств объектов и восстановление данных. Компьютерные системы ИАД, реализующие количественный 18М-метод, продемонстрировали универсальность метода при решении существенно различных задач:

• прогнозирование рецидива аденомы гипофиза (в нейрохирургии),

• распознавание кодировки НТМЬ-документов на русском языке (в системах просмотра документов глобальной компьютерной сети Интернет),

• восстановление номинальных анкетных данных (в социологических исследованиях).

В Заключении дается краткое перечисление полученных результатов, определяются возможные пути продолжения исследуемой темы. 1

JSM-метод как средство интеллектуального

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Григорьев, Петр Александрович

1.5. Выводы

В заключение этого раздела отметим следующие обстоятельства.

Во-первых, на примере задачи распознавания кодировки НТМЬ-документов, количественный Т8М-метод успешно зарекомендовал себя, как средство автоматизированного создания алгоритмов распознавания. Выгода применения такого подхода очевидна - он позволяет создавать эффективные алгоритмы при минимальных трудозатратах. Система СЬаг8е1Весос1ег была разработана менее чем за неделюЛ силами коллектива из двух программистов.

Во-вторых, для решения этой задачи была использована стратегия отложенного применения правил вывода второго рода: правила первого рода применялись (однократно) на стадии разработки программной системы, а правила второго рода - (многократно) на стадии эксплуатации.

В-третьих, были получены вполне интерпретируемые гипотезы: большинство фрагментов-причин состояли из морфов русского языка (в основном - флексий), либо же устойчивых сочетаний морфов. Это обстоятельство обеспечило безупречное распознавание кодировки даже для документов с орфографическими ошибками и придуманными

Не считая времени, потраченного на тестирование системы, что составило еще около полутора недель. словами. В частности, система успешно распознает кодировку знаменитого примера Л.В.Щербы "Глокая куздра штеко будланула бокра и кудрячит бокренка", а также более распространенных в Интернет примеров из программистского жаргона, как то: "интеррапт слипера по таймеру", "хедер бажный - компилится с варнингами" и т.д.

2. Прогнозирование рецидива аденомы гипофиза

В 1997-98 годах автором совместно с Брускиной Д.Г. был проведен ряд компьютерных экспериментов [12], [22]. Целью этих экспериментов являлась оценка возможности создания интеллектуальной партнерской системы, которая позволяла бы определить степень риска возникновения у больного рецидива аденомы гипофиза после ее удаления. На основе количественного JSM-метода нами была разработана экспериментальная система прогнозирования рецидива аденомы гипофиза, которая носит рабочее название HTRD (Hypophisis tumor relapse diagnostics).

В результате проделанной работы мы можем описать ключевые характеристики и область применения этой системы.

1) Партнерская система прогнозирования рецидива аденомы гипофиза (ПСП РАГ) основана на анализе случаев аденомы гипофиза (САГ).

2) С помощью ПСП РАГ можно выявлять такие наборы характеристик САГ, которые значительно повышают степень риска возникновения рецидива. Нет никаких гарантий, что удастся выявлять все такие наборы.

3) С помощью ПСП РАГ можно частично прогнозировать рецидив аденомы гипофиза. Это означает, что по описанию САГ система может сделать: a) заключение о том, что опасность рецидива (очень) велика, b) заключение о том, что система не способна оценить опасность рецидива.

В этом смысле, практическая ценность ПСП РАГ заключается именно в том, что она позволит обратить особое внимание на те (к сожалению, не все те) САГ, опасность рецидива которых велика.

Для проведения этого исследования, в качестве экспериментальных данных институт Нейрохирургии им. Бурденко предоставил компьютерную базу данных, в которой зафиксированы случаи аденомы гипофиза (САГ) за последние 10 лет. В этой базе данных использовалось атрибутивное представление объектов. Таким образом, данные представляют собой таблицу, в которой строкам соответствуют САГ, столбцам - их характеристики. К таким характеристикам относятся расположение и размер опухоли, гормональная активность опухоли, возник ли у данного больного после удаления рецидив и другие. Важно отметить, что все характеристики в таблице - нечисловые. Например, размер опухоли описывается по пятизначной шкале - маленькая, небольшая, средняя, большая и гигантская.

Формально, в этой задаче объектами и фрагментами являются множества пар вида <а, у >, где а есть атрибут конкретного САГ, V - его значение. Например, {<злокач., +>, <размер, ср>, < 8Тв, ->} описывает САГ со следуюш,ими характеристиками: опухоль злокачественная, среднего размера, гормоны группы 8ТО не выделяет.

Операция сходства определяется в этой задаче как теоретико-множественное пересечение атрибутивных представлений САГ. Пусть о, 8 суть описания САГ: о = {< злокач., +>, <размер, ср>, < 8ТО, ->, < РКОЬ, +>},

8 = {< злокач., +>, <размер, м>, < 8ТО, ->, < РКОЬ, ->}.

Тогда о П 8 = {< злокач., +>, < 8ТО, ->}. То есть, сходство этих объектов фиксирует тот факт, что обоих случаях опухоль злокачественная и не выделяет гормоны группы 8ТО.

Целевым свойством в этой задаче является свойство САГ "сопровождаться рецидивом".

Гипотезы о причинах целевого свойства были получены системой НТКО на основе анализа обучающей выборки. Последняя состояла из 240 описаний САГ, про 68 из которых было известно, что они сопровождались рецидивом.

Для тестовой выборки из 400 примеров полнота прогнозирования составила 43%, точность - 76%.

Эксперты ИЫХ им. Бурденко дали высокую оценку интерпретируемости полученных гипотез: каждая гипотеза была охарактеризована как класс отягчающих факторов, вызывающих рецидив аденомы. К существенным недостаткам системы была отнесена низкая (сравнительно с методами деревьев решений) полнота прогнозирования.

3. Восстановление номинальных анкетных данных в социологических исследованиях.

Основанная на количественном 18М-методе, система восстановления номинальных данных "СВ-2" была разработана в 1998 году на кафедре логико-математических основ гуманитарного знания Российского государственного гуманитарного университета.

Система "СВ-2" позволяет восстанавливать пропущенные значения в таблицах номинальных данных. Строки в таких таблицах соответствуют объектам, столбцы - номинальным параметрам этих объектов. Мы называем параметр номинальным, если множество его допустимых значений не упорядоченно по семантической близости, то есть, любые три значения параметра в одинаковой степени попарно различны. Отметим, что любой бинарный параметр, то есть параметр, допускающий всего два значения, является номинальным. Примеры номинальных параметров:

• пол (бинарный параметр, допустимые значения суть

II ^ II II II \ мужской и женский )

• семейное положение; (допустимые значения суть "женат(замужем)/живем вместе без регистрации брака", "вдовец(вдова)", "разведен (разведена)", "живем порознь, но не разведены", "холост(не замужем), "никогда не была в браке").

Примером неноминального параметра является возраст, указанный в годах. Действительно, значения "51 год" и "52 года" семантически ближе друг к другу, чем "51 год" и "25 лет".

Система "СВ-2" поддерживает два режима обучения: режим полного обучения и режим ускоренного обучения.

Режим полного обучения рассчитан на сравнительно небольшое количество объектов, то есть, этот режим следует применять для таблиц с небольшим количеством строк. В зависимости от ширины таблицы и разнообразия значений ее параметров, максимальное количество строк, допустимое для работы в этом режиме, колеблется от 20 до 100. В худшем случае, работа в режиме полного обучения занимает экспоненциальное время относительно количества строк в таблице. Это означает, что при добавлении одной строки в таблицу время обучения возрастает приблизительно в два раза. Преимущество работы в режиме полного обучения состоит в том, что системой этом случае порождаются и проверяются все возможные причины.

Режим ускоренного обучения позволяет восстанавливать данные в таблицах с достаточно большим числом строк -приблизительно до 2500. Работа в режиме ускоренного обучения занимает квадратичное время относительно количества строк в таблице. Это означает, что при увеличении количества строк в таблице в два раза, время обучения возрастает приблизительно в четыре раза. При ускоренном обучении порождаются и проверяются не все причины, а только так называемые устойчивые причины, то есть те причины, которые проявляют себя достаточно часто.

Ниже приводятся результаты тестирования системы "СВ-2" на материале опроса общественного мнения, проведенного Всероссийским центром изучения общественного мнения (ВЦИОМ) в 1997 году. Результаты опроса представлены в виде таблицы, каждой строке которой соответствует конкретная заполненная анкета, а каждому столбцу - вопрос в анкете.

Тестирование производилось на кафедре Логико-математических основ гуманитарного знания Российского государственного гуманитарного университета. Цель тестирования - определить точность и полноту восстановления данных с помощью системы "СВ-2". Под точностью мы понимаем отношение числа правильно восстановленных значений к общему числу восстановленных значений.

Под полнотой - число восстановленных значений (правильно или не правильно) к числу изначально отсутствующих значений. Например, пусть до восстановления данных в таблице отсутствовало 100 значений, то есть, сто клеток были пусты. И пусть система восстановила 80 значений, причем 60 - правильно, а 20 - неправильно. То есть, в восьмидесяти из ста клеток появились значения, причем двадцать из этих значений не соответствовали действительности. Тогда точность восстановления есть 60/80, то есть 0.75, или 75%. Полнота же восстановления данных в этом случае составляет - 80/100, то есть 0.8, или 80%

Для того чтобы определить точность и полноту восстановления данных, мы выбрали десять вопросов (формулировки некоторых из них приводятся на Рис. 7). Для каждого из этих вопросов мы провели серию из трех однотипных испытаний, которые состояли в следующем:

1) В исходной таблице случайным образом выбрали п% строк. Для первого испытания это составило 10%, для второго - 50%, для третьего - 90%.

2) После этого, во всех остальных строках значения выбранного вопроса удалили.

3) Предоставили системе для обучения выбранные п% строк.

4) После обучения, предоставили системе для восстановления оставшиеся (100-п)%) строк.

5) Сравнили полученные результаты с исходной таблицей

Вопрос №1. СКАЖИТЕ, ДЕЛА В СТРАНЕ ИДУТ В ПРАВИЛЬНОМ НАПРАВЛЕНИИ, ИЛИ ВАМ КАЖЕТСЯ, ЧТО СОБЫТИЯ ВЕДУТ НАС "НЕ ТУДА", В ТУПИК?

Варианты ответов:

1 дела идут в правильном направлении

2 события ведут нас в тупик 9 затрудняюсь ответить

Вопрос №9. СКАЖИТЕ, ПОЖАЛУЙСТА, КАКОЕ ИЗ СЛЕДУЮЩИХ УТВЕРЖДЕНИЙ, ПО ВАШЕМУ МНЕНИЮ, НАИБОЛЕЕ ТОЧНО ОПИСЫВАЕТ СИТУАЦИЮ В СТРАНЕ?

Варианты ответов:

1 становление диктатуры

2 сохранение прежнего политического порядка год новыми названиями

3 развитие демократии

4 утрата порядка, нарастание анархии 9 затрудняюсь ответить

Вопрос №11. в ПРИНЦИПЕ, ЕСЛИ НЕ ПРИНИМАТЬ ВО ВНИМАНИЕ НЫНЕШНЮЮ ПОЛИТИЧЕСКУЮ СИТУАЦИЮ, ДЕМОКРАТИЧЕСКАЯ СИСТЕМА УПРАВЛЕНИЯ - ЭТО ТО, ЧТО НУЖНО РОССИИ ИЛИ то, ЧТО ВРЕДНО для НЕЕ?

Варианты ответов:

1 1^жго России

2 вредно для России

9 затрудняюсь ответить

Вопрос №22А. ЕСЛИ БЫ У ВАС БЫЛА ВОЗМОЖНОСТЬ ВЫБОРА, КАКИЕ УСЛОВИЯ ВЫ БЫ ПРЕДПОЧЛИ?

Варианты ответов:

1 когда больше порядка в стране, но меньше личной свободы

2 когда больше личной свободы, но меньше порядка в стране 9 затрудняюсь ответить

Вопрос № 40А. СКАЖИТЕ, БУДЕТЕ ЛИ ВЫ ПРИНИМАТЬ УЧАСТИЕ В "МИРНОЙ" АКЦИИ ПРОТЕСТА МИТИНГА,ДЕМОНСТРАЦИИ, РАЗРЕШЕННЫХ ВЛАСТЯМИ?

Варианты ответов:

1 скорее всего да

2 скорее всего нет

9 затрудняюсь ответить

Рисунок 7. Примеры номинальных анкетных вопросов.

Полнота распознавания составила от 38% до 70% при среднем -52% и моде - 65%. Точность распознавания составила от 68%) до 96% при среднем - 84% и моде - 85%).

При сравнении эффективности применения "СВ-2" и других систем ИАД эксперты ВЦИОМ прежде всего отметили высокую точность восстановления данных при помощи "СВ-2". К существенным недостаткам системы была отнесена сравнительно низкая полнота восстановления. В настоящее время автором в сотрудничестве с представителями ВЦИОМ ведется разработка новой версии системы, основанной на правилах с умолчаниями, а также фальсификации 18М-гипотез второго рода по схеме "победитель забирает все". Цель этой модификации - максимально повысить полноту восстановления данных.

Заключение в заключение подведем итоги настоящей работы.

В текстологическом порядке, содержание работы кратко можно охарактеризовать следующим образом:

В первой главе было дано определение интеллектуального анализа данных (ИАД); перечислены наиболее известные методы ИАД, предложена их классификация; подробно рассмотрен один из весьма перспективных методов ИАД - 18М-метод автоматического порождения гипотез.

Во второй главе была рассмотрена классификация предметных областей по типам закономерностей, в них доминирующих, а именно: частотных закономерностей, жестких причинно-следственных закономерностей и причинно-следственных закономерностей, допускающих несистематические изменения. Далее во второй главе построена формализация интуитивного понятия количественной аргументации обще-импликативных гипотез (гипотез вида \/х:Р(х)зР(х)). На основе этой формализации разработана система требований корректности к количественным критериям фальсификации гипотез: "разумный" критерий должен сохранять отношение ассоциативной привлекательности и быть бесконфликтным. Построена система схем правил правдоподобного вывода количественного 18М-метода, в которой параметром является

1 U U U с» бесконфликтный ассоциативный критерий количественной фальсификации гипотез. Рассмотрены алгоритмические аспекты автоматического правдоподобного вывода в предложенной системе правил.

В третьей главе были изложены результаты применения количественного Т8М-метода при решении практических задач. Рассмотрено три направления применения метода: распознавание кодировки НТМЬ-документов, прогнозирование рецидива аденомы гипофиза (после удаления) и восстановление номинальных анкетных данных в социологических исследованиях.

Основным теоретическим результатом работы является создание метода Р1А.Д эффективно работающего в областях с частично детерминированными свойствами объектов - количественного JSM-метода. Метод формализует 18М-рассуждение, обогащенное количественными критериями фальсификации гипотез. К достижениям работы следует отнести:

1. Построение системы правил правдоподобного вывода для порождения и проверки гипотез о зависимостях, допускающих исключения.

2. Формализацию принципов, которым должны удовлетворять количественные критерии фальсификации гипотез.

3. Построение эффективного алгоритмического аппарата, реализующего автоматический вывод в предложенной системе правил.

4. Разработку комплекса программного обеспечения, основанного на предложенном количественном 18М-методе, и внедрение его для решения задач ИАД в нескольких разнородных предметных областях: медицине, социологии, сетевом обеспечении.

Два наиболее существенных направления развития предложенной темы суть следующие:

1. Разработать методику выбора количественного критерия фальсификации гипотез, наиболее эффективного для решения той или иной конкретной задачи ИАД. В этом направлении может оказаться весьма перспективным применение методов мягких вычислений для настройки числовых коэффициентов критериев фальсификации гипотез.

2. Изучить корректность и эффективность выборочного подхода, при котором формирование гипотез производится по сравнительно небольшой обучающей выборке, формируемой случайным образом, а фальсификация - по всей выборке. Для этого потребуется формализовать понятие устойчивой JSM-гипотезы.

Список литературы диссертационного исследования кандидат технических наук Григорьев, Петр Александрович, 2000 год

1. Аншаков О. М. О решетке данных для ДСМ-метода автоматического порождения гипотез. // НТИ. Сер. 2.-1996.-№ 5-6

2. Аншаков ОМ. 1-логики и соответствующие им классы алгебр. // Логические исследования. Вып. 5.— М.: Наука.— 1998.— С.25-52.

3. Аншаков О.М. Об одной интерпретации ДСМ-метода автоматического порождения гипотез // НТИ. Сер. 2.— 1999.— № 1-2.— С. 45-53.

4. Аншаков О.М. Логико-математические основания ДСМ-метода автоматического порождения гипотез.— Диссертация на соискание ученой степени доктора физико-математических наук.— М:ВИНИТИ.— 2000.— 246 с.

5. Аншаков О.М. Каузальные модели предметных областей. // М:НТИ. Сер. 2.—2000.—№3.

6. Аншаков О.М., Скворцов Д.П., Финн В.К. Логические средства экспертных систем типа ДСМ // Семиотика и информатика.— 1986.— Вып. 28.—С. 65-101.

7. Аншаков О. М., Скворцов Д. П., Финн В.К., Ивашко ВТ. Логические средства ДСМ-метода автоматического порождения гипотез: основные понятия и система правил вывода. // НТИ. Сер. 2.-1987.-№ 9

8. Аншаков О.М., Скворцов Д.П., Финн В.К. О дедуктивной имитациинекоторых вариантов ДСМ-метода автоматического порождения гипотез // Семиотика и информатика.— 1993.— Вып. 33.— С. 164-233.

9. Блинова ВТ., Ивашко В.Г., Скитер П.В., Финн В.К, Хазановский К.П. Об интеллектуальных системах типа ДСМ // Семиотика и информатика.—М.— 1990.—Вып. 31.—Стр. 41-69.

10. Бобылева Н.В., Ивашко В.Г., Краснова В.М., Финн В.К. Применение ДСМ-систем в задачах технической диагностики // Семиотические аспекты формализации интеллектуальной деятельности: Тез. докл. школы-семинара "Боржоми-88".— М.:ВИНТИ.— 1988.—С. 178-182.

11. Братко И. Программирование на языке Пролог для искусственного интеллекта.— М.:Мир.— 1990.— 560 с.

12. Бру скина Д. Г. ДСМ-подобная система для компьютерного прогнозирования рецидива аденомы гипофиза.— Дипломная работа.— М.:РГГУ.— 1998.

13. Виноградов Д.В. Алгебраическая модель связанных свойств ДСМ-метода // НТИ-97. Информационные ресурсы. Интеграция. Технологии. Материалы конференции.— М.:ВИНИТИ.— 1997.— С. 59.

14. Виноградов Д.В. Логические программы для квазиаксиоматических теорий // НТИ. Сер. 2.— 1999.— № 1-2.— С. 61-64.

15. Гаек П, Гавранек Т. Автоматическое образование гипотез.— М.: Наука, 1984.—280 с.

16. Гемпелъ КГ. Логика объяснения.— М.: Дом интеллектуальной книги.— 1998.—240 с.

17. Гладкий A.B. Математическая логика.— М.: РГГУ.— 1998.— 479 с.

18. Григорьев П.А. Об одном методе автоматического порождения гипотез, схожем с ДСМ-методом: применение статистических соображений // НТИ. Сер. 2.— 1996.— № 5-6.— С. 52-55.

19. Григорьев П.А. Sword-системы или ДСМ-системы для цепочек, использующие статистические соображения // НТИ. Сер. 2.— 1996.— №5-6.-0.45-5 1.

20. Григорьев П.А. Об одной модернизации ДСМ-метода: применение статистических соображений.— Дипломная работа.— М:РГГУ.— 1997.

21. Григорьев П.А. Результаты тестирования системы восстановления номинальных данных "СВ-2". // Материалы международной научной конференции "НТИ-99. Интеграция. Информационные Технологии. Телекоммуникации". М.: ВИНИТИ. — 1999.— С. 241-242.

22. Григорьев П.А. О перспективах компьютерного прогнозирования рецидива аденомы гипофиза // НТИ. Сер. 2.— 1999.— № 1-2.— С. SS-SS.

23. Забежайло М.И., Ивашко В.Г., Кузнецов С.О., Михеенкова М.А., Хазановский К.П., Аншаков О.М. Алгоритмические и программные средства ДСМ-метода автоматического порождения гипотез // НТИ. Сер. 2.— 1987.— № 10.— С. 1-14.

24. Забежайло M.K Формальные модели рассуждений в принятии решений: приложения ДСМ-метода в системах интеллектуального управления и автоматизации научных исследований. // НТИ. Сер. 2.— 1996.— № 5-6.— С. 20-33.

25. Кузнецов СО. Интерпретация на графах и сложностные характеристики задач поиска закономерностей определенного вида // НТИ. Сер. 2.— 1989.— № 1— С. 23-28.

26. Кузнецов СО. Введение в ДСМ-метод // Семиотика и информатика.—1990. —Вып. 31.—С. 5Л0.

27. Кузнецов СО ДСМ-метод как система автоматизированного обучения // Итоги науки и техники. Сер. «Информатика». Т. 15.— М: ВИНИТИ,1991. — 17-53.

28. Кузнецов СО. Быстрый алгоритм построения всех пересечений объектов из конечной полурешетки. // НТИ. Сер. 2.— 1993.— № 1.— С. 17-20.

29. МейерД. Теория реляционных баз данных .— М.: Мир, 1987.— 608 с.

30. Мшль Д.С Система логики силлогистической и индуктивной.— М.: Книжное дело, 1900.— 781 с.

31. Михеенкова М.А. ДСМ-метод правдоподобного рассуждения как средство анализа социального поведения // Известия РАН. Сер. «Теория и системы управления».— 1997.—Л№ 5.— С . 62-70.

32. Объедков CA. Алгоритмические аспекты ДСМ-метода автоматического порождения гипотез // НТИ . Сер . 2.— 1999.— № 1-2.— С. 64-75.

33. Панкратов Д.В. О возможности применения ДСМ-метода в задаче распознавания химического канцерогеноза. // НТИ . Сер . 2.— 1999.— № 1-2.— С. 76-82.

34. Путрин А., Панкратова Е., Программная реализация интелектуальной системы типа ДСМ для распознавания химической канцерогенности // НТИ . Сер . 2.— 1997.—№ 3.—С. 8-11.

35. СкворцовД.П. О некоторых способах построения логических языков с кванторами по кортежам // Семиотика и информатика.— 1983.— Вып. 20.—С. 102-126.

36. Уоссермен Ф. Нейрокомпьютерная техника.— М.: Мир, 1992.— 236 с.

37. Финн В.К. О возможностях формализации правдоподобных рассуждений средствами многозначных логик // Всесоюзный симпозиум по логике и методологии науки .— Киев : Наукова думка , 1976.—С .82-83.

38. Финн В.К. Базы данных с неполной информацией и новый метод автоматического порождения гипотез // Диалоговые и фактографические системы информационного обеспечения .— М.,1981.—С . 153-156.

39. Финн В. К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Ф.Бэкона — Д.С.Милля // Семиотика и информатика.—1983.— Вып. 20.— С. 35-101.

40. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения // Итоги науки и техники. Сер. «Теория вероятностей. Матем. статистика. Теоретическая кибернетика». Т. 28.—М: ВИНИТИ, 1988.— С. 3-84.

41. Финн В.К. Об обобщенном методе автоматического порождения гипотез // Семиотика и информатика.— 1989.— Вып. 29.— С. 93-123.

42. Финн, В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ.— Итоги науки и техники. Сер. Информатика.— Т. 15 (Интеллектуальные информационные системы).— 1991.— С. 54-101.

43. Финн В.К Об интеллектуальных системах автоматизированной поддержки научных исследований // НТИ. Сер. 2.— 1996.— № 5-6.— С. 1-2.

44. Финн В.К. Об одном варианте логики аргументации // НТИ. Сер. 2.— 1996.—№5-6.—С. 3-19.

45. Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер. 2.— 1999.— № 1-2.— С. 8Л5.

46. Черч А. Введение в математическую логику, т. 1.— М.: ИЛ.—1961.

47. Anshakov О.М., Finn V.K., Skvortsov D.P. On axiomatization of manyvalued logics associated with formalization of plausible reasoning // Studia Logica.— 1989.— Vol. 48. N4.— pp. 423-447.

48. Bornholdt, S. and Graudenz, D. General Assymmetric Neural Networks and Structure Design by Genetic Algorithms. // Neural Networks, N5.— 1992.— pp.327-334

49. Chen M.S., Han J., Yu P.S. Data Mining: An Overview from a Database Perspective.// IEEE Transactions on Knowledge and Data Engineering. —1996. — Vol 8.— pp. 866-883.

50. Donoho, S. K. Knowledge-Guided Constructive Induction. Ph.D. thesis, Department of Computer Science, University of Illinois at Urbana-Champaign.— 1996

51. Ganter B. Kapitel Algorithmen zur Formalen Begriffsanalyse.— BI-Wissenschaftsverlag.— 1987.

52. Ganter B, Wille R. Formal Concept Analysis. Mathematical Foundations.— Berlin-Heidelberg-New York: Springer.— 1999.

53. Goldberg, D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. MA: Addison-Wesley.— 1989.

54. GotthardW., Marwick A., SeittertR. Mining Text Data // DB2 Magazine.—1997. —V2.— http://www.db2mag.com/97wiGot.htm

55. Hajek P., Havranek T., Chytil M. Metoda GUHA. Automoticka tvorba hypotez.— Praha: Academia.— 1983.

56. Haykin, S. Neural Networks: A Comprehensive Foundation.— NY: Macmillan College Publishing.— 1994.

57. KiselevM. V. PolyAnalyst a machine discovery system inferring functional programs // Proceedings of AAAI Workshop on Knowledge Discovery in Databases'94, Seattle.— 1994.— pp. 237-249.

58. KiselevM. V. PolyAnalyst 2.0: Combination of Statistical Data Preprocessing and Symbolic KDD Technique // Proceedings of ECML-95 Workshop on Statistics, Machine Learning and Knowledge Discovery in Databases, Heraklion, Greece.— 1995.— pp.187-192.

59. Kuznetsov S. O. Mathematical aspects of formal concept analysis // Journal of Mathematical Science, Series Contemporary, Mathematics and its Applications.— 1996.— no. 18.— pp. 1654-1698.

60. Leherte L., Glasgow J., Baxter K., SteegE., Fortier S. Analysis of Three-Dimensional Protein Images // Journal of Artificial Intelligence Research.— 1997.—V7.—pp. 125-159.

61. MullerB., Reinhardt J. Neural Networks. An introduction.— Berlin:Springer Verlag.— 1991.

62. Ordonez C., Omiecinski E. Discovering Association Rules Based On Image Content // IEEE Advances in Digital Libraries.—1999.—VI.—pp. 28-41.

63. Piatetsky-Shapiro G, Frawley W.J., Knowledge Discovery in Databases.-US, California: AAAI Press.— 1991.

64. Quinlan, J. R. Simplifyng decision trees // International Journal of Man-Machine Studies, N49.— 1987.— pp.221-234.

65. Quinlan. J. R. Generating production rules from decision trees. // Proceedings of the 10th International Joint Conference on Artificial Intelligence, Milan.— 1987.— pp. 304-307.

66. Rosser J.B., Turquette A.R. Many-valued logics.— Amsterdam: North-Holland.— 1951.

67. Umbreit, S. Formale Begriffsanalyse mit unscharfen Begriffen.— Dissertation an der Mathematisch-Naturwissenschaftlich-Technischen Fakultat der Martin-Luther-Universitat, Halle-Wittenberg.— 1995.

68. VogtF. Formale Begriffsanalyse mit C++.— Berlin: Springer.— 1996.

69. Wille R. Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts// Ordered Sets, I. Riw2A,Ed.~ Reidel.— 1982.— pp. 445-470.

70. Zadeh, Lotfi. Fuzzy Sets // Information and Control.— 8(3) .— 1965.— pp.338-353.

71. Zadeh Lotfi Fuzzy Logic, Neural Networks, and Soft Computing. Communications of the ACM.— 1994. — Vol. 37. — pp.77 84

72. Рисунок 8. Классификационное дерево: стоимость 2-х комнатнойквартиры в крупном городеА.

73. Будем называть множество гипотез, порождаемых соответствующим методом интеллектуального анализа данных

74. Треб. ремонта, да>} =i> <Цена, низкая>.

75. Теперь рассмотрим наиболее существенные преимущества МПДР перед 18М-методом.

76. Классификационные деревья зачастую являются удобным средством визуализации данных. JSM-метод не предоставляет средств для визуализации данных.

77. МПДР способны работать в условиях зашумленности данных, в то время как традиционные разновидности JSM-метода очень чувствительны к ошибкам в данных.2. Сравнение методов ИАД.

78. STRUCT ATTR NOM NUMS NUMG NOISE SMTS1. POLY1.TERPR VIS

79. Методы построения деревьев решений1. Методы мягких вычислений

80. Методы символьного обнаружения знаний1. СиНА-метод1. Анализ формальных понятий1. Л8М-метод1. Количественный Л8М-метод+

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.