Разработка алгоритмических и программных средств для реализации стратегий ДСМ-метода автоматического порождения гипотез тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Волкова, Анна Юрьевна
- Специальность ВАК РФ05.13.17
- Количество страниц 305
Оглавление диссертации кандидат наук Волкова, Анна Юрьевна
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1 ДСМ-РЕШАТЕЛЬ ДЛЯ АНАЛИЗА ДАННЫХ РАЗЛИЧНЫХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ
1.1 Внутреннее представление данных
1.2 ОБЩАЯ СТРУКТУРА ДСМ-РЕШАТЕЛЯ И РЕАЛИЗАЦИЯ СТРАТЕГИЙ ДСМ-МЕТОДА АПГ
1.2.1 Общая структура ДСМ-Решателя
1.2.2 ДСМ-РАССУЖДЕНИЯ
1.2.2.1 ИНДУКТИВНЫЙ ВЫВОД ДСМ-РАССУЖДЕНИЙ
1.2.2.1.1 Базовые методы ДСМ-рассуждений
1.2.2.1.1.1 Простой метод сходства
1.2.2.1.1.2 Единственность причины (следствия)
1.2.2.1.1.3 Запрет на контрпримеры
1.2.2.1.2.1 Метод различия: миллевский вариант
1.2.2.1.2.2 Метод различия: упрощение метода сходства - различия
1.2.2.1.2 Метод соединенного сходства - различия
1.2.2.1.2.1 Метод соединенного сходства-различия с единственной причиной
1.2.2.1.2.2 Общий метод соединенного сходства-различия
1.2.1.1.3 Метод остатков
1.2.1.1.3.1 Общий метод остатков
1.2.2.1.3.2 Усеченный метод остатков
1.2.2.2 ПРАВИЛА ПРАВДОПОДОБНОГО ВЫВОДА ПО АНАЛОГИИ
1.2.2.3 АБДУКЦИЯ И СТЕПЕНЬ АБДУКТИВ1ЮСТИ
1.2.3 ВСПОМОГАТЕЛЬНЫЕ ПРОЦЕДУРЫ
1.2.3.1 Фильтры
1.2.3.2 Доопределение по одному
1.2.3.3 «Дерево» гипотез
1.2.3.4 Проверка непротиворечивости гипотез
2 ВИЗУАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
2.1 Представление данных в фармакологии
2.2 Представление данных в медицине
2.2.1 Представление в Microsoft Office Excel
2.2.2 Представление в Microsoft Office Access
2.3 Представление данных в социологии
3 ГРАФИЧЕСКИЙ ИНТЕРФЕЙС ДСМ-РЕШАТЕЛЯ
4 АНАЛИЗ ФАРМАКОЛОГИЧЕСКИХ И МЕДИЦИНСКИХ ДАННЫХ: ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА
4.1 Стандартные стратегии ДСМ-метода АПГ
4.1.1 Простой метод сходства
4.1.2 Единственность (+)-причины
4.1.3 Запрет на контрпримеры
4.2 Метод различия
4.2.1 Метод различия: миллевский вариант
4.2.2 Метод различия: упрощение метода сходства - различия
4.3 Метод соединенного сходства - различия
4.4 Метод остатков
4.4.1 Общий метод остатков
4.4.2 Усеченный метод остатков
4.5 Проверка непротиворечивости гипотез
5 ДСМ-СИСТЕМА JSM-SOCIO ДЛЯ АНАЛИЗА СОЦИОЛОГИЧЕСКИХ ДАННЫХ
5.1 ДСМ-система JSM-Socio и современные программы для качественного анализа социологических данных
5.2 Описание возможностей ДСМ-системы JSM-Socio
5.3 Применение ДСМ-системы JSM-Socio на практике
5.4 Средства предсказания изучаемых эффектов ДСМ-системы JSM-Socio
ЗАКЛЮЧЕНИЕ
Список литературы
Список иллюстраций
Приложение А. Классы для реализации процедур и стратегий ДСМ-метода АПГ
Приложение Б. ДСМ-Решатель: Руководство пользователю
Приложение В. Компьютерная интеллектуальная система JSM-Socio: Руководство пользователю
Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Система процедур ДСМ-метода автоматического порождения гипотез и ее реализации2000 год, кандидат технических наук Путрин, Андрей Валерьевич
Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе2021 год, кандидат наук Чебанов Дмитрий Константинович
Разработка средств представления знаний и архитектуры интеллектуальной системы для прогнозирования путей биотрансформации2002 год, кандидат технических наук Фабрикантова, Елена Федоровна
Алгоритмические и программные средства анализа данных о биотрансформациях и результирующем эффекте от введения в организм двух химических соединений2003 год, кандидат технических наук Матвеев, Андрей Анатольевич
Метаматематические исследования правдоподобных рассуждений типа ДСМ2000 год, кандидат физико-математических наук Виноградов, Дмитрий Вячеславович
Введение диссертации (часть автореферата) на тему «Разработка алгоритмических и программных средств для реализации стратегий ДСМ-метода автоматического порождения гипотез»
ВВЕДЕНИЕ
Огромную роль в развитии направления исследовании «искусственным интеллект» играет интеллектуальный анализ данных (ИАД). В англоязычной литературе ему обычно соответствуют термины «data mining» и «knowledge discovery», однако, по-видимому, это верно лишь при широком толковании ИАД как извлечения нового полезного знания из неформализованных данных посредством различных формальных методов (статистические процедуры, нейронные сети, генетические алгоритмы, деревья решений и др.). Мы же под ИАД понимаем анализ данных посредством интеллектуальной системы (ИС) [1].
Структуру интеллектуальной системы можно представить в виде трех основных блоков. Информационная среда, Решатель задач и Интеллектуальный интерфейс [2]. Информационная среда состоит из базы фактов (БФ) и базы знаний (БЗ). БФ содержит множество фактов, которые являются результатами эмпирического исследования. БЗ включает аксиомы, характеризующие исследуемую предметную область, аксиомы структуры данных и процедуры, которые реализует Решатель задач.
Решатель задач в свою очередь состоит из трех модулей: Рассуждатель, Вычислитель и Синтезатор. Они осуществляют, соответственно, правдоподобные выводы, вычисления, необходимые для решения поставленной задачи, объединение рассуждений, вычислений и комбинаторных алгоритмов. Синтезатор также выбирает стратегии решения задач [3].
Интеллектуальный интерфейс является средством общения пользователя с ИС и выполняет такие функции, как [4]: диалог на естественном языке (обычно ограниченном), автоматический синтез программы (в данном случае речь идет способность вызывать процедуры Решателя задач), обоснование полученных результатов и обучение работе с системой.
Интеллектуальные системы типа ДСМ (ДСМ-системы) являются примером ИС, которые реализуют когнитивные правдоподобные эмпирические (КПЭ) рассуждения типа «индукция + аналогия + абдукция» (с возможным применением дедукции). Как рассмотрено в [1], КПЭ-рассуждения можно эффективно использовать для имитации познавательных способностей естественного интеллекта, а именно - цикла «анализ данных - порождение гипотез (предсказание) - объяснение» [3].
ДСМ-рассуждения формализуются средствами бескоиечнозначной логики предикатов с кванторами по кортежам переменной длины [5] и реализуются в ИС с использованием машинного (индуктивного) обучения для knowledge discovery в базах фактов [3].
ДСМ-метод автоматического порождения гипотез (АПГ) включает б компонент [3, 6]: условия применимости, правдоподобные рассуждения, квазиаксиоматические теории как средство организации БФ и БЗ, исследования предметной области (дедуктивная имитация индукции, аналогии и абдукции, определения исходных предикатов, препроцессинг), средства распознавания эмпирических закономерностей и интеллектуальные системы типа ДСМ (ИС-ДСМ). Все компоненты ДСМ-метода представлены в диссертации.
ДСМ-метод является мощным логико-комбинаторным методом интеллектуального анализа данных, который применим в различных предметных областях при выполнении следующих условий [7]:
(а) Знания предметной области могут быть плохо формализованы, но данные хорошо структурированы, что позволяет определить на изучаемых объектах операцию сходства.
(б) База фактов содержит описание предметной области и «..образована фактоподобными высказываниями вида «объект С имеет множество свойств А», которым приписаны оценки «фактически истинно» (1), «фактически ложно» (-1), «фактически противоречиво» (0), «неопределенно» (т)» [7, С.400]. Множество свойств А называют эффектом. Положительные примеры (с типом истинностного значения, равным 1) обладают исследуемым эффектом, отрицательные примеры (с типом истинностного значения, равным -1) - не обладают. Неопределенные примеры (с типом истинностного значения, равным т) - это примеры, требующие доопределения.
(в) В БФ неявно должны содержаться зависимости причинно-следственного типа: (±)-причины исследуемых эффектов.
ДСМ-метод АПГ отвечает принципам компьютерного интеллектуального анализа данных (knowledge discovery), а именно [6]:
1. ДСМ-метод является синтезом познавательных процедур для извлечения знаний из баз фактов (БФ).
2. ДСМ-системы удовлетворяют принципу качественного анализа данных: «сходство фактов в БФ влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Мы можем задать алгебраическую операцию нахождения сходства двух фактов, так как в БФ реализуется определенная структура данных. Правдоподобные рассуждения используют отношение сходства.
3. ДСМ-метод включает несколько этапов фальсификации, встроенные в процедуры индукции и аналогии.
4. ДСМ-рассуждение завершается применением абдукции - процедуры объяснения исходного множества фактов и принятия на этом основании порождённых гипотез.
5. Знания в базах знаний (БЗ) представлены в виде квазиаксиоматических теорий (КАТ), которые содержат формализованное представление множества аксиом (частично характеризующих предметную область), расширяемые БФ и множество гипотез, а также множество правил вывода.
6. ДСМ-метод АГТГ фактически реализует схему роста знаний эволюционной эпистемологии K.P. Поппера [8, С. 164-165].
Таким образом, ДСМ-метод АПГ является формализованной эвристикой, которая позволяет создавать компьютерные системы, решающие определенный круг задач для различных предметных областей. ДСМ-системы успешно применялись к таким предметным областям, как фармакология, медицинская и техническая диагностика, социология, криминалистика, робототехника [5, 7, 9, 10, 11, 12]. Перечень основных публикаций можно найти в [12].
Эффективность ИС-ДСМ зависит как от возможностей Решателя, так и представления данных в БФ и знаний в БЗ. Созданные ранее ДСМ-системы обычно применялись для решения практических задач одной предметной области и имели Решатель, реализующий базовые методы ДСМ-рассуждений: простой метод сходства и его усиления - запрет на контрпримеры.
Созданная в ходе диссертационного исследования ДСМ-система не только предоставила реализацию стандартных методов, но и расширила возможности Решателя новыми стратегиями. На практике удалось провести анализ данных на разных предметных областях, удовлетворяющих условиям применимости ДСМ-метода. Было разработано представление данных трех предметных областей: фармакологии,
медицинской диагностики и социологии. Архитектура системы позволила применить к ним один и тот же Решатель, что делает систему «универсальной» относительно рассматриваемых БФ и БЗ.
В Решателе впервые было реализовано четыре индуктивных метода Д.С. Милля [13]. Созданные методы были протестированы на данных фармакологии и медицинской диагностики. Проведенные эксперименты показали интересные результаты и позволили сравнить различные стратегии между собой. В процессе работы с социологическими данными были реализованы процедуры обратного ДСМ-метода и предусмотрена поддержка ситуационного расширения ДСМ-рассуждений.
Концепция ИС-ДСМ и архитектура Решателя были специализированы для решения социологических задач. Была создана автономная компьютерная ИС 1БМ-Босю, посредством которой были исследованы задачи с новым представлением знаний: описание субъекта (социальный характер субъекта, индивидуальные черты личности, биографические данные), мнение субъекта (о ситуации, о возможном поведении), ситуация (контекст поведения). ^М-Босю является подспорьем социологам для решения задач качественного анализа социологических данных.
Актуальность диссертационного исследования обусловлена необходимостью создания Решателя задач, применимого к сериям компьютерных ИС для различных предметных областей и обладающего эффективными средствами для извлечения знаний из баз фактов. Такие ИС должны предоставить реализацию новых стратегии ДСМ-рассуждений, способных облегчить работу эксперта по анализу результатов работы системы.
Таким образом, предметом исследования диссертации являются методы анализа данных посредством правдоподобных рассуждений типа ДСМ и их применимость для задач фармакологии, медицинской диагностики и социологии. Средства анализа данных включают различные логические процедуры ДСМ-рассуждений, подходящую структуру представления данных и комфортный интерфейс для работы эксперта.
Цель диссертационной работы - создание Решателя задач и компьютерной интеллектуальной системы, реализующих ДСМ-метод АПГ для различных предметных областей в науках о жизни и социальном поведении, а также обоснование того факта, что разработанная ИС может эффективно применяться в конкретной предметной области - социологии. В связи с этим необходимо было разработать не зависящие от
предметной области алгоритмы и программы, реализующие ДСМ-рассуждения; создать компьютерную ДСМ-систему, допускающую широкий выбор возможных ДСМ-стратегий; провести эксперименты (с использованием реализованных программных средств) на данных различных предметных областей и сравнить полученные результаты; создать спецификацию ИС для качественного анализа социологических данных.
Для достижения указанной цели были поставлены и решены следующие задачи:
• разработана ДСМ-система с гибкой архитектурой, допускающей расширение ее функциональных возможностей, для анализа данных различных предметных областей;
• реализованы различные версии ДСМ-метода АПГ (прямой [13] /обратный [14] ДСМ-метод, ситуационное расширение [15] ДСМ-метода);
• создана программная реализация разнообразных методов ДСМ-рассуждений (в том числе четырех индуктивных методов Д.С. Милля [13]);
• созданы различные дополнительные процедуры ДСМ-рассуждений (например, реализация фильтров для гипотез (специальные ограничения на структуру гипотез, требующие присутствие определенных признаков в «теле» гипотезы), процедура «доопределение по одному» (процедура, позволяющая охарактеризовать исходную базу фактов относительно выбранной стратегии), построение дерева гипотез, вычисление непротиворечивости массивов гипотез);
• реализованы структуры данных для различных предметных областей и разработаны представления и форматы данных, обрабатываемых ДСМ-системой, для фармакологии, медицинской диагностики и социологии;
• разработан базовый графический интерфейс пользователя для «универсального» ДСМ-Решателя с целью проведения экспериментов с данными указанных выше областей;
• проведено сравнение результатов экспериментов, полученных разными стратегиями на фармакологических и медицинских данных;
• создана независимая ДСМ-система ^М-Босю для качественного анализа социологических данных с удобным графическим интерфейсом и апробация системы на практическом материале.
Для решения указанных задач использовались следующие методы: многозначная логика с целью представления знаний и формализации рассуждений, алгоритмы порождения сходств, технологии создания баз данных.
Информационном базой исследования стали многочисленные публикации по ДСМ-методу АПГ, приведенные в списке используемой литературы, а также знания, полученные в процессе тесного взаимодействия с экспертами в данной области.
Основные научные результаты, полученные в ходе исследования:
• Разработана архитектура ДСМ-системы, позволяющая применять ее для различных предметных областей. Архитектура ИС представлена в первой главе «ДСМ-Решатель для анализа данных различных предметных областей». Графический интерфейс ИС рассмотрен в третьей главе «Графический интерфейс ДСМ-Решателя». «Руководство пользователю» представлено в Приложении Б.
• Разработано представление данных фармакологии, медицинской диагностики и социологии, адекватное для применения процедур ДСМ-рассуждении. Внутреннее представление данных рассмотрено в первой главе, а внешнее (формат необходимые характеристики данных) - во второй главе «Визуальное представление данных».
• Впервые был реализован ДСМ-Решатель, отличающийся наличием широкого выбора методов и стратегий ДСМ-рассуждении (в том числе четырех индуктивных методов Д.С. Милля [13]: метод простого сходства, метод различия, метод сходства-различия, метод остатков). Методы алгоритмически и программно были реализованы впервые, тем самым удалось расширить существующий арсенал методов машинного обучения. Все созданные процедуры ДСМ-рассуждений рассмотрены в первой главе. Основные классы для реализации процедур и стратегий ДСМ-метода АПГ представлены в Приложении А.
• Была осуществлена симметризация ДСМ-процедур в Решателе (все методы можно применять как для (+)-, так и для (-)-предикатов). Появилась возможность проводить эксперименты, выбирая одинаковые или разные по силе методы, и сравнивать результаты относительно исследуемой БФ. Реализация процедур рассмотрена в первой главе.
• Был установлен тот факт, что метод различия Д.С.Милля [13], который он считал наиболее полезным для выявления причинно-следственных закономерностей, не дает полезных результатов в практических исследованиях. Результаты
представлены в четвертой главе «Анализ фармакологических и медицинских данных: экспериментальная проверка».
Проведено сравнение результатов применения различных стратегий ДСМ-метода (среди которых ряд стратегий программно был реализован впервые) к фармакологическим и медицинским данным. Эксперименты проводились на реальных данных, для анализа которых ранее использовали только базовые методы ДСМ-рассуждепий (метод простого сходства и запрет на контрпримеры). Были получены интересные результаты, хотя порой данные не удовлетворяли условиям ДСМ-процедур. Эксперименты с применением новых методов рассмотрены в четвертой главе.
В ходе исследования медицинских (онкологических) данных была реализована процедура, упрощающая метод остатков. С ее помощью была подтверждена важная причинно-следственная связь на данных больных меланомой между протеином Б100 и продолжительностью жизни больного: при значении уровня Б100 меньше 0,12 нг/мл продолжительность жизни больного - больше 5 лет, при значении уровня Б100 больше 0,12 нг/мл - меньше 5 лет. (Впервые эта связь была обнаружена Добрыниным Д.А. и Панкратовой Е.С. в результате компьютерных экспериментов с использованием ДСМ-системы, созданной в ВИНИТИ РАН [26]). Реализация этой процедуры рассмотрена в первой главе, детали эксперимента - в четвертой главе.
Удалось выявить связь между протеином Б100 и продолжительностью жизни больных меланомой с помощью преобразования метода сходства-различия, образующего современную формализацию индуктивного метода различия Д.С.Милля (что означает большее правдоподобие этой гипотезы). Этот результат представлен в четвертой главе.
В результате практических экспериментов на данных фармакологии была скорректирована формулировка метода сходства-различия (с заменой отношения невложения друг в друга найденных причин на неравенство). Это продемонстрировано в четвертой главе.
Созданы средства распознавания непротиворечивости гипотез, которые могут применяться в связи с задачами поиска эмпирических закономерностей [44] и для объединения результатов разных стратегий. Реализация процедуры рассмотрена в первой главе, пример применения - в четвертой главе.
• Реализована компьютерная поддержка качественного (нестатистического) анализа социологических данных посредством интеллектуальной системы (ИС-ДСМ JSM-Socio). Разработанное представление социологических данных позволяет анализировать примеры со сложной структурой, включающей описание субъекта, его мнение и ситуацию. Продемонстрировано, что JSM-Socio может эффективно использоваться на практике. Система рассмотрена в пятой главе «ДСМ-система JSM-Socio для анализа социологических данных». Кроме того, в Приложении В представлено «Руководство пользователю».
Первые системы, предназначенные для решения задач медицинской диагностики, были разработаны в 1970-х годах и являлись экспертными [16]. Экспертная система (ЭС) является частным случаем интеллектуальной системы. На основе сообщений эксперта строятся база фактов (проверенные знания, которые публикуются в статьях и справочниках) и база знаний (эмпирические правила, эвристики, которые представляют собой методы и правила, которые эксперт применяет в своей практике). Разработчики ЭС формализуют полученные знания в виде продукционных правил вида {«условия» -> «действия»} или {антецедент -> консеквент}, представленных в языке логики предикатов 1-ого порядка и его усилений, с помощью семантических сетей и проч. [16, С.61] и реализуют устройство вывода, которое использует имеющиеся формализованные знания. В системе продукций для реализации вывода используется вывод, «определяемый условиями» (condition-driven inference) или вывод, «определяемый действием» (action-driven inference) [16, С.61-62]. Когда пользователь задает вопрос системе, устройство вывода дает ответ на основе БФ, БЗ и стратегий, которые были в него заложены. Очевидно, что эффективность работы ЭС в этом случае зависит только от тех знаний, которые удалось получить от эксперта.
Одна из наиболее известных систем такого типа - это система MYCIN, разработанная в начале 1970-х годов в Стэнфордском университете (http://ru.wikipedia.org/vviki/MYCIN). Система была предназначена для диагностирования бактерий, вызывающих тяжелые инфекции (бактериемия, менингит), для рекомендации необходимого количества антибиотиков в зависимости от массы тела пациента и для диагностики заболеваний свертываемости крови. MYCIN оперировала с помощью базы знаний из около 600 правил и машины вывода, которая осуществляла процедуры обратного поиска (вывод, «определяемый действием»).
Другой пример подобных систем - это система CASNET, предназначенная для диагноза и терапии глазных заболеваний [16, С.65]. Знания в системе были формализованы с помощью причинно-следственной семантической сети, посредством которой устройство вывода определяло эффективность терапии и стадию заболевания пациента.
Недостатки ЭС (трудность формализации знаний эксперта, неспособность обучаться и порождать новые знания) послужили толчком к развитию интеллектуальных экспертных систем (ИЭС), которые способны автоматически порождать правила и эмпирические зависимости [16, С.68]. На сегодняшний день в литературе можно найти много примеров таких систем. Они предназначены для решения различных задач и используют самые разные методы, в том числе методы искусственного интеллекта, например: машинное обучение, нейронные сети, генетические алгоритмы, распознавание образов и т.д. Стоит отметить, что одно из крупнейших зарубежных издательств Elsevier публикует журнал, который так и называется «Искусственный Интеллект в Медицине» (Artificial Intelligence in Medicine, http://www.aiimjournal.com).
В 1980-90-х годах был создан ряд отечественных медицинских систем: ДИАГЕН для диагностики наследственных болезней, ЭСТЕР для диагностики лекарственных отравлений, ГЕНРОСТ для диагностики заболеваний с нарушением роста, ДИН для диагностики неотложных состояний у детей, ВЕСТ-СИНДРОМ для диагностики судорожных состояний (эпилепсии) и др. [17]
Извлечение знаний в этих системах осуществлялось с привлечением интеллектуальной составляющей, например, введение ассоциативных знаний о симптомах заболевания, представленных в виде двунаправленного взвешенного графа, определение степени значимости каждого признака, выступающей в роли априорной вероятности для байесовского метода, введение признаков-отрицаний, однозначно отсекающих заболевания с альтернативным проявлением признаков (ДИАГЕН); построение таблицы запрещенных значений «диагностический признак - класс решений» (ЭСТЕР); использование технологии виртуальных статистик, которые формировались с использованием теоремы Байеса и учитывали диагностические оценки экспертов по обобщенным проявлениям болезни [17].
Другой пример отечественной медицинской системы, использующей непосредственно методы искусственного интеллекта, — это ДИАКОР-КС для диагностики и коррекции коммуникативного стресса [18]. Система использует
оригинальное матричное представление данных и знаний и алгоритмы логико-комбинаторного выявления закономерностей с использованием и без использования генетических алгоритмов, а также включает механизмы проверки обучающей выборки на непротиворечивость и определения ее репрезентативности. На основе результатов системы ДИАКОР-КС была построена система ДИАПРОД для экспресс-диагностики и профилактики 3-х степеней тяжести депрессии. Инструментальный аппарат ДИАПРОД базируется на пороговой и нечеткой логике [19].
Наиболее распространенные средства, которые используют зарубежные медицинские системы, - это нейронные сети, теория вероятностей, нечеткая логика, генетические алгоритмы, деревья принятий решений [20]. Интеллектуальные системы широко используются для решения различных задач клинической диагностики и прогнозирования заболеваний, для назначения необходимого лечения пациентам, для анализа изображений в рентгенографии и гистопатологии, для анализа электроэнцефалограмм [21, 22], а также при создании медицинских интеллектуальных роботов [23, 24]. Примеры таких систем - это PERFEX для автоматического анализа снимков, полученных с помощью компьютерной томографии сердца и сосудов (1991); GIDEON для диагностики тропических и инфекционных заболеваний (1994); PAIRS для диагностики сложных случаев более 7000 заболеваний (2001); ERA для диагностики онкологических больных (2001); LISA для предоставления консультаций о дозах лекарств при лечении острого лимфобластного лейкоза у детей (2004); медицинские роботы Aesop (1994) и EndoAssist (2002), система da Vinci® (2001), которые используются врачами для проведения хирургических операций.
ДСМ-метод АПГ использует формализацию рассуждений и реализует познавательный цикл «анализ данных - порождение гипотез (предсказание) -объяснение» с использованием машинного (индуктивного) обучения [3].
Первая ДСМ-система для анализа данных медицинской диагностики была создана в ВИНИТИ РАН. ДСМ-метод применялся для прогнозирования и диагностики различных заболеваний. Решались следующие задачи [7, 9, 25, 26]:
1. Прогнозирование высокопатогенных типов вируса папилломы человека (ВПЧ) по цитологическим результатам исследования мазков (Кафедра клинической и лабораторной диагностики Российской медицинской академии последипломного образования).
2. Диагностика двух заболеваний глаз: дегенеративного ретиношизиса и наследственных витреоретинальных дистрофий (Лаборатория клинической физиологии зрения МНИИ глазных болезней им. Гельмгольца).
3. Диагностика системной красной волчанки (Отделение нефрологии Городской клинической больницы им. Боткина).
4. Прогнозирование продолжительности жизни больных меланомой и оценка прогностического биохимического маркера - протеина S100 (Российский Онкологический Научный Центр РАМН имени H.H. Блохина).
Применялись стратегии простого метода сходства и сходства с запретом на контрпримеры.
На текущий момент в ВИНИТИ РАН действующие системы для анализа медицинских данных программно были реализованы ДА. Добрыниным и О.П. Шестеряиковой [27]. Системы реализуют прямой ДСМ-метод АПГ. Множество свойств изучаемого объекта атомарно, то есть оно может включать только одно свойство. Для проведения экспериментов доступны процедуры простого метода сходства и запрета на контрпримеры. Среди дополнительных характеристик систем следует отметить возможность вводить ограничения на число родителей гипотез, на структуру гипотез (фильтры), а также проводить процедуру «доопределение по одному». Каждая система имеет развитый предметно-ориентированный графический интерфейс. Необходимо также упомянуть, что официально была зарегистрирована "Компьютерная интеллектуальная система прогнозирования клинического течения меланомы", предназначенная для применения в качестве компьютерного инструмента для врача-онколога (Свидетельство №2012615098). Система используется в РОНЦ им. H.H.Блохина РАМН для формирования группы риска больных меланомой. Система такого типа создана впервые.
Первым примером задач, для решения которых применялся ДСМ-метод, было выявление причинно-следственных закономерностей в фармакологии [5, 7, 9]. Эти задачи представляли собой прогнозирование биологических активностей химических соединений (например, противоопухолевой, психотропной, антибактериальной, антилепрозной, канцерогенной, мутагенной и токсичной активностей), прогнозирование канцерогенного эффекта при совместном введении двух химических соединений, а также прогнозирование путей биотрансформации (преобразование введенного в организм вещества в другие соединения).
Действующая система для анализа фармакологических данных программно была реализована Д.А. Добрыниным. ДСМ-Решатель системы поддерживает прямой атомарный ДСМ-метод АПГ, включающий процедуры простого метода сходства и запрета на контрпримеры.
В социологии ДСМ-системы применялись для решения таких задач, как изучение поведения рабочих на примере участия или неучастия в забастовках [28, 29, 30, 31], анализ и предсказание электоральных предпочтений студентов старших курсов Российского Государственного Гуманитарного Университета накануне декабрьских выборов в Государственную Думу в 2003 и 2007 годах [9].
Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Создание компьютерной системы интеллектуального анализа фармакологических данных2006 год, кандидат технических наук Максин, Михаил Владиславович
Комбинаторные средства формализации эмпирической индукции2015 год, кандидат наук Забежайло, Михаил Иванович
Создание информационной среды для интеллектуальной системы анализа социологических данных2006 год, кандидат технических наук Бурковская, Жанна Ивановна
Система планирования решений задач на основе дедуктивных и ассоциативных методов2000 год, кандидат физико-математических наук Малышко, Виктор Васильевич
Принципы и логические средства интеллектуального анализа социологических данных2011 год, доктор технических наук Михеенкова, Мария Анатольевна
Список литературы диссертационного исследования кандидат наук Волкова, Анна Юрьевна, 2014 год
Список признаков
х1 К какой категории работников Вы относитесь''
Содержание Вашей работы, то, что приходится делать в рабочее врем Я9 Равномерность обеспечения работой Я10 Оплата труда
я12 Санитарно-гигиенические условия труда
Обеспечение безопасности Я14 Стабильность работы отсутствие угрозы сокращения Я15 Отношения с Вашим непосредственным руководителем (мастером, * Я16 Справедливость оценки Вашей работы ql-Перспективы профессионального роста, продвижения я18 Деятельность администрации по улучшению работы предприятия х65 Ваш возраст $74 Предприятие в75 Подразделение
5~6 Соотношение среднедушевого дохода респондента и личных доходе!
Соответствие заработной платы работника и средней зарплаты по П] 580 Коэффициент желаемой заработной платы (в разах)
Категория
Отображение
описание
очистить все
Г описание
Г" мнение
Г ситуация
Г" неразмеченные
Р отображать все
3) Каждый признак отображается в списке одной строкой.
Выделите признаки, которые требуется отнести к одной из компонент объекта,
нажатием левой кнопки мыши по строкам списка. Выделенные признаки будут
выделены жирным шрифтом и будут иметь красную точечную рамку.
Чтобы снять выделения с выбранных признаков, нажмите кнопку «ЗДЕСЬ» над
списком.
Выделите признаки и нажмите на соответствующую кнопку Нажмите
здесь
, чтобы снять выделение с признаков Список признаков
;х1.к какой категории работников Вы относитесь?
1ч8.Содержание Вашей работы, то, что приходится делать в рабочее
^.Равномерность обеспечения работой
qlO Оплата труда
Я12 Санитарно-гигиенические условия труда ц13 Обеспечение безопасности
ql 4 Стабильность работы, отсутствие угрозы сокращения ql 5 Отношения с Вашим непосредственным руководителем (мастером, & ql 6 Справедливость оценю! Вашей работы 417 Перспективы профессионального роста, продвижения ql 8 Деятельность администрации по улучшению работы предприятия хб5 Ваш возраст $74 Предприятие $75 Подразделение
$76 Соотношение среднедушевого дохода респондента и личных доходот 578 Соответствие заработной платы работника и средней зарплаты по П] 580 Коэффициент желаемой заработной платы (в разах)
описание
ситуация
очистить
очистить все
V описание
Г мнение
Г ситуация
Г неразмеченные
Р отображать все
4) Когда признаки выделены, нажмите на соответствующую кнопку: «описание», «мнение», «ситуация». Строка признака станет окрашена в соответствующий цвет, а
выделение автоматически сбросится.
Выделите признаки и нажмите на соответствующую кнопку
Нажмите
здесь
чтобы снять выделение с признаков Синеок признаков
х1 К какой категории работников Вы относитесь1
я8 Содержание Вашей работы, то, что приходится делать в рабочее врем 49 Равномерность обеспечения работой
0 Оплата труда 412 Санитарно-гигиенические условия труда ч13.0беспечение безопасности
4 Стабильность работы, отсутствие угрозы сокращения ql5 Отношения с Вашим непосредственным руководителем (мастером, ь 416 Справедливость оценки Вашей работы
7 Перспективы профессионального роста, продвижения ql8 Деятельность администрации по улучшению работы предприятия х65 Ваш возраст
574 Предприятие
575 Подразделение
^б.Соотиошенне среднедушевого дохода респондента и личных дох 578.Соответствне заработной платы работника и средней зарплаты :$80.Коэффициент желаемой заработной платы (в разах)
II
описание • мнение •I ситуация • |
очистить очистить все
Г описание
Г" мнение
Г ситуация
Г неразмеченные
Р отображать все
5) Если вы обнаружили, что какие-то признаки распределены неверно, выделите эти признаки и нажмите либо на цветную кнопку (чтобы поменять компоненту), либо на кнопку «очистить», чтобы исключить признак из выборки эксперимента.
Выделите признаки и нажмите на соответствующую кнопку.
Нажмите
здесь
, чтобы снять выделение с признаков. Список признаков
Категория
х1.К какой категории работников Вы относитесь?
q8.Содержание Вашей работы, то, что приходится делать в рабочее врем
Равномерность обеспечения работой я10.Оплата труда
2.Санитарно-гигиенические условия труда qlЗ.Обеспечение безопасности
Я14.Стабильность работы, отсутствие угрозы сокращения
ql 5.Отношения с Вашим непосредственным руководителем (мастером, ь
6.Справедливость оценки Вашей работы ql7.Пepcпe^cпIвы профессионального роста, продвижения q 18.Деятельность администрации по улучшению работы предприятия х65.Ваш возраст б 7 4 Предприя тие 575 Подразделение
;з76.Соотиошенне среднедушевого дохода респондента п личных дох
578.Соответствие заработной платы работника и средней зарплаты по п] 580.Коэффициент желаемой заработной платы (в разах)
описание
мнение
ситуация
очистить • )
очистить все
6) Чтобы сбросить разметку со всех признаков, нажмите кнопку «очистить все».
7) Если признаков много, то, используя флажки в столбце «Отображение», можно регулировать видимость признаков по категориям.
Выделите признаки и нажмите на соответствующую кнопку Нажмите
здесь
, чтобы снять выделение с признаков Спвсок признаков
х1.К какой категории работников Вы относитесь? q8 Содержание Вашей работы, то, что приходится делать в рабочее врем я9 Равномерностъ обеспечения работой
ц10 Оплата труда
шзвшшвшшшшшяш
414 Стабильность работы, отсутствие угрозы сокращения
Отношения с Вашим непосредственным руководителем (мастером, ( Справедливость оценки Вашей работы ql" Перспективы профессионального роста, продвижения
5 Деятельность администрации по улучшению работы предприятия х65 Ваш возраст 5~4 Предприятие §75 Подразделение
Соотношение среднедушевого дохода респондента и личных доходо!
Ш
описание
мнение
J
ситуация
очистить
очистить все
Р описание
Г мнение
Г ситуация
Г неразмеченные
Г отображать все
Классификация признаков
Выделите признаки и нажмите на соответствующую кнопку Нажмите
здесь
чтобы снять выделение с признаков Список признаков
х1 К какой категории работников Вы относитесь? q8 Содержание Вашей работы, то, что приходится делать в рабочее врем q9 Равномерность обеспечения работой
qlO Оплата труда
Ч12 Санитарно-гигиенические условия труда
qlЗ Обеспечение безопасности
ql4 Стабильность работы отсутствие угрозы сокращения <^15 Отношения с Вашим непосредственным руководителем (мастером, 1 ql6 Справедливость оценки Вашей работы ql" Перспективы профессионального роста, продвижения я!8 Деятельность администрации по улучшению работы предприятия хб5 Ваш возраст 5*4 Предприятие $"5 Подразделение 5_6 Соотношение среднедушевого дохода респондента и личных доходо1 578.Соответствие заработной платы работника и средней зарплаты по п)
вЗО.Коэффициент желаемой заработной платы (в разах)
Категория
описание
очистить
J
ситуация
}
очистить все
Отображение
Р описание
Р мнение
Р ситуация
Г неразмеченные
Г" отображать все
Разметка признаков в данном разделе необязательна. Если вы не планируете использовать фильтры в эксперименте, вы можете переходить к следующему разделу.
1) Откройте раздел «Настройка фильтров».
Общая структура объекта
Классификация признаков
Выбор респондентов
Выбор стратегии и эксперимент
2) В окне содержания раздела отобразится список размеченных признаков, а также дополнительные элементы управления. Используя кнопки с изображениями фильтров, вам необходимо разметить признаки.
Выделите признаки и нажмите на соответствующую кнопку
Нажмите
здесь
, чтобы снять выделение с признаков Список признаков
х1 К какой категории работников Вы относитесь?
я8 Содержание Вашей работы, то, что приходится делать в рабочее врем Равномерность обеспечения работой 0 Оплата труда 412 Санитарно-гигиенические условия труда qlЗ Обеспечение безопасности
Стабильность работы, отсутствие угрозы сокращения я15 Отношения с Вашим непосредственным руководителем (мастером ( я1б Справедливость оценки Вашей работы ц17 Перспективы профессионального роста, продвижения 418 Деятельность администрации по улучшению работы предприятия хб5.Ваш возраст $74 Предприятие 5*5 Подразделение
$16 Соотношение среднедушевого дохода респондента и личных доходот 578 Соответствие заработной платы работника и средней зарплаты по п^ 580 Коэффициент желаемой заработной платы (в разах)
а- <-) и
О- <») ИЛИ В - (-) И С-()ИЛИ |
очистить
очистить все I
Г описание
Г мнение
Г" ситуация
I- неразмеченные
17 отображать все
Различают конъюнктивные фильтры для (+)- и (-)-гипотез, которые объявляют признак необходимым (его присутствие в гипотезе обязательно) и дизъюнктивные фильтры для (+)- и (-)-гипотез, которые объявляют признак существенным (в гипотезе обязательно присутствие одного из отмеченных признаков).
Изображение Значение
и конъюнктивный фильтр для (+)-гипотез
о дизъюнктивный фильтр для (+)-гипотез
в конъюнктивный фильтр для (-)-гипотез
о дизъюнктивный фильтр для (-)-гипотез
Каждый признак отображается в списке одной строкой. 3)
Выделите признаки, которые требуется отнести к фильтру, нажатием левой кнопки мыши по строкам списка. Выделенные признаки будут выделены жирным шрифтом и будут иметь красную точечную рамку.
4) 5) Список признаков Тип фильтра
И $-ИЛИ х1.К какой категории работников Вы относитесь?
ф-ИЛИ Содержание Вашей работы, то, что приходится де.
я9 Равноыерность обеспечения работой я10 Оплата труда
я12.Санитарно-гигиенические условия труда и - М и
qlЗ.Обеспечение безопасности
q 14.Стабильность работы, отсутствие угрозы сокращения ql5 Отношения с Вашим непосредственным руководителем (мастером, ь Справедливость оценки Вашей работы ql7.Перспективы профессионального роста, продвижения ql8.Дeятeльнocть администрации по улучшению работы предприятия х65 Ваш возраст 574.Предприятие 575.Подразделение Ив.Соотношение среднедушевого дохода респондента и личных доходо! О = (*) ИЛИ
О - (-) И
О = (-> ИЛИ
ОЧИСТИТЬ
578 Соответствие заработной платы работника и средней зарплаты по п] очистить все
580.Коэффициент желаемой заработной платы (в разах)
1
Чтобы снять выделения с выбранных признаков, нажмите кнопку «ЗДЕСЬ» над списком.
Фильтры для признаков
Выделите признаки Нажмите
:ите на соответствующую кнопку.
здесьт; чтобы снять выделение с признаков.
Список признаков
км- и О- ИЛИ х1.К какой категории работников Вы относитесь?
О или q8.Содержание Вашей работы, то, что приходится делатп q9.Paвнoмepнocть обеспечения работой 0.Оплата труда Санитарно-гигиенические условия труда Обеспечение безопасности
4.Стабильность работы, отсутствие угрозы сокращения ql5.Отношения с Вашим непосредственным руководителем (мастером, * ql 6.Справедливость оценки Вашей работы ql 7.Перспективы профессионального роста, продвижения ql 8.Деятельность администрации по улучшению работы предприятия хб5.Ваш возраст 574.Предприятие 57 5. Подразделение 576 Соотношение среднедушевого дохода респондента и личных доходо] 578.Соответствие заработной платы работника и средней зарплаты по п] 580.Коэффициент желаемой згфаботной платы (в разах)
<1
Тип фильтра
М и
о- ( + ) ИЛИ
в - (-> и
о = {-) ИЛИ
очистить
очистить все
6) Когда признаки выделены, нажмите на соответствующую кнопку:
(+) И, (+) ИЛИ, (-) И, (-) ИЛИ. В начале строки появится соответствующее изображение. Обратите внимание, что выделение автоматически НЕ сбросится!
Вы можете назначить каждому признаку максимум 2 фильтра: один - для (+)-гипотез, другой - для (-)-гипотез. При нажатии кнопок для разметки фильтров, изображения в начале строки будут изменяться соответственно.
7) Если вы обнаружили, что какие-то признаки распределены неверно, выделите эти признаки и нажмите либо на кнопку с изображением фильтра (чтобы поменять фильтр), либо на кнопку «очистить», чтобы убрать фильтры с признака.
8) Чтобы сбросить разметку со всех признаков, нажмите кнопку «очистить все».
9) Если признаков много, то, используя флажки в столбце «Отображение», можно регулировать видимость признаков по категориям.
10) Пример полученной разметки:
Фильтры для признаков
Выделите признаки и нажмите на соответствующую кнопку.
Нажмите
здесь
, чтобы снять выделение с признаков. Список признаков
Тип фильтра
У-и О- ИЛИ х1.К какой категории работников Вы относитесь? q8.Содержание Вашей работы, то, что приходится делать в рабочее врем Я9.Равномерность обеспечения работой qlO.Оплата труда
-ИЛИ СЭ-И ql 2 Санитарно-гигиенические условия труда Обеспечение безопасности ql 4 Стабильность работы, отсутствие угрозы сокращения Я15.Отношения с Вашим непосредственным руководителем (мастером, * ql6.Справедливость оценки Вашей работы ql7.Перспективы профессионального роста, продвижения ql8.Деятельность администрации по улучшению работы предприятия х65.Ваш возраст б74.Предприятие
575. Подр азд ел ени е
576.Соотношение среднедушевого дохода респондента и личных доход01 578.Соответствие заработной платы работника и средней зарплаты по п] О-ИЛИ $80.Коэффициент желаемой заработной платы (в разах)
У - М и
О = (*) ИЛИ
□ = (-) и
О - ( ) ИЛИ
очистить
очистить все
1) Откройте раздел «Выбор респондентов».
2) В окне раздела данные респондентов представлены таблицей.
Таблица включает поля «Порядковый номер» (№ п/п), «Оценка» (оценка зависит от разметки значений целевого свойства в разделе «Общая структура объекта», см. п. 3.4), «Выбрать», столбец с целевым свойством и столбцы с остальными признаками.
Устанавливая флажок в столбце «Выбрать» напротив респондента, вы вносите его в выборку для эксперимента.
очистить выбрать всех
Л» п п Опенка Выбрать 17 xl Ч8 49 qlO Ч12 ql3 ql4 ql5 q 16 ql7 ql8 x65 s74 s75 s76 s78
1 + Р 1 2 1 1 3 2 2 2 1 2 5 5 64 1 95 0 0
2 + Р 1 6 1 п 2 4 1 1 1 1 1 4 70 1 55 n 0
3 + W 2 6 2 2 3 4 5 5 5 5 5 5 30 1 1 0 n
4 + Р 2 6 1 1 3 3 2 2 1 1 2 4 28 1 1 0 0
5 - р 3 6 1 5 4 4 2 3 1 2 2 4 24 1 1 0 0
6 - р 3 5 2 2 4 2 1 1 1 1 3 4 20 1 1 0 0
7 - р 4 2 2 3 4 4 4 4 1 4 5 4 21 1 1 n 0
8 0 р 5 2 3 4 4 4 4 5 1 4 4 27 1 1 0 0
9 - р 4 2 4 4 4 3 5 3 1 4 3 3 47 1 1 0 0
10 + р 1 1 1 1 5 5 5 5 1 1 1 5 25 1 1 n 0
11 + р 2 2 3 3 3 1 2 2 1 n 3 3 33 i * n 0 0
12 + р 2 2 1 2 3 3 1 1 1 3 2 23 2 n 0 0
13 - р 3 4 2 1 3 1 1 1 2 3 2 25 2 n 0 0
14 + р 1 1 2 3 4 2 2 5 5 2 2 3 27 2 n 0 •
15 + г 2 6 2 2 3 3 2 1 3 2 3 25 2 n 0 0
16 + г ■J т 3 2 2 3 2 2 2 1 2 3 3 26 2 n n It
17 + г 1 1 1 4 4 3 3 5 1 2 5 n 26 2 n 0 n
1
По умолчанию при первой обработке файла Excel для эксперимента выбраны все респонденты.
Если вы уже использовали файл для обработки, то будут отмечены респонденты, выбранные в прошлый раз.
3) Для того чтобы выбрать всех респондентов, нажмите на кнопку «выбрать всех».
4) Для того чтобы снять флажок со всех записей, нажмите на кнопку «очистить».
1) Откройте раздел «Выбор стратегии и эксперимент».
Обшая структура объекта
Классификация признаков
Настройка фильтров
Выбор респондентов
Выбор стратегии и эксперимент
2) В окне раздела появятся настройки для проведения эксперимента.
еее
О Открыть Просмотр результатов' Г П. дг.к.иг. н»ый пгс1 факл для ^Лfl^rтrя Г3 И».»нит1 пьктитма! п«1 ^тьт
Ф«Атс
°«>» I
J
I Обшая структур* объект«
* Классификация Пр|ЮМКОВ
о,
О Настройка фат»трое О Выбор реегюняето» О Выбор стратегии и эксперимент
Эксперимент
Выберет» стратеги» ДС'М-метоза автоматического порождения т
Л«а*Л1КТ«ЛкВЫе шстраЛки
Г Ограничить количество ппрндй ДСМ-рассужцнвЛ
Д.» |*1-гш»И]
Г* Применит» - --фильтры I* Засфст ш (- -контрпример I® Запрет и (0)-кок1рцршмр
ДжОпшатм \ilMtMAnbHOf количество рогвпел** Р Применит» -фильтры I» Запрет м (-Укоктрарелаер Г* Запрет на (Оу-кетрсфтмер
Дм (О)-гаа
Проверьте <по все настройки серны
Учтите что при большом количестве признаков н респондентов оораоотка ааниьг. может занять длительное время
О——-. О ——
3) Из выпадающего списка выберите стратегию ДСМ-метода АПГ: прямой или обратный ДСМ-метод:
Эксперимент
Выберите стратегию ДСМ-метода автоматического порождения гипотез. | Прямой
ишшЯНН
¡Обратный
11) Если в выборке респондентов присутствуют те, у которых оценка изучаемого эффекта - «неопределенно», и после получения гипотез система смогла доопределить оценку хотя бы для одного респондента, то процесс ДСМ-рассуждений будет повторяться до стабилизации (все неопределенные объекты доопределены или ни один пример больше не доопределяется).
12)
Если вы хотите ограничить процесс, то необходимо поставить флажок напротив дополнительной настройки «Ограничить количество итераций ДСМ-рассуждений» и указать количество итераций.
Дополнительные настройки:
Г Ограничить количество итераций ДСМ-рассуждений: | 1*
Такая необходимость может возникнуть, если порождается очень много гипотез из-за большого количества неопределенных примеров. Однако, следуя логике ДСМ-рассуждений, данную настройку применять не рекомендуется.
(Если гипотез порождается слишком много, это означает, что имеет смысл еще раз проанализировать данные и, возможно, выбрать другие признаки для эксперимента.)
4) Пересекая данные респондентов с оценками «истина», «ложь» и «противоречие», системой будут получены (+)-, (-)- и (О)-гипотезы соответственно.
Для (+) и (-)-гипотез можно установить следующие настройки:
Минимальное количество родителей гипотезы (по умолчанию 2). Применить (±)-фильтры. Запрет на контрпримеры.
Для (+)-гнпоте!
Минимальное количество родителей: | 2
I* Применить (+)-фильтры Г? Запрет на (-)-контрпример Запрет на (0)-контрпример
Для (-)-гнпоте!
Минимальное количество родителей: | 2
Р Применить (-)-фильтры 17 Запрет на (+)-контрпример Р Запрет на (0)-контрпример
По умолчанию напротив настроек для фильтров и контрпримеров стоит флажок, что означает «применить данную настройку».
Приведем краткое пояснение к настройке «Запрет на контрпримеры».
Настройка Пояснение
Запрет на (-)-контрпример Ни один (-)-пример не вкладывается в (+)-гипотезу.
Запрет на (+)-контрпример Ни один (+)-пример не вкладывается в (-)-гипотезу.
Запрет на (О)-контрпример Ни один (О)-пример не вкладывается в (+)/(-)-
гипотезу.
5) Для (О)-гипотез можно изменить только «Минимальное количество родителей».
Для (0)-гнпотез
Минимальное количество родителей:
6) Когда вы заполнили всю необходимую информацию во всех разделах, нажмите на кнопку «1. Запомнить настройки».
Проверьте, что все настройки верны
Учтите, что при большом количестве признаков и респондентов обработка данных может занять длительное время
О
запомнить настроики
О
провести эксперимент
Настройки будут сохранены, и вы увидите сообщение «Настройки сохранены успешно»:
Интеллектуальная система ДСМ. Предметная область - СОЦИОЛОГИЯ.
Настройки сохранены успешно.
ок
7) Теперь можно приступать к формированию гипотез. Нажмите на кнопку «2. Провести эксперимент».
8) Откроется консольное окно, в которой будут выводиться данные обработки: считаны ли корректно данные, номер итерации ДСМ-рассуждений, текущее количество пересечений по (+)-, (-)- и противоречивым гипотезам.
fj Интеллектуальная система ДСМ. Предметная область - СОЦИОЛОГИЯ.
с V E:\Files_ANMA\Aspirantura •.Proqrain«\JSM_Sy4teiTi_Sociology_HTA\CPP_Modules\ JSM_Solver_
В Открыть 'Просмотр результатов'
Г Подготовить новый excel файл для обработки
F Использовать существующий excel файл
Файл с исходны
И Общая струю
^JnjxJ
Е
Классификац
Настройка ф(
Выбор pecnoi
[Respondents' data are read successfully.
¡Итерация ДСМрассуждений 1 :
1 <♦> гипотез(ы).. .
2 <♦> гипотез(ы).. . ¡3 <♦> гипотез<ы>... 15 <♦> гипотез(ы)... 6 <♦> гипотез<ы>...
8 < О гмпотез<ы>.. .
9 <+> гипотез(ы)... 1 <-> гипотез(ы)... ¡2 <-> гипотез(ы)... |3 <-> гипотез(ы). . . 14 <-> гипотез<ы>. ..
Алгоритм закончил работу? Кол—во тау-прииеров = 0. Доопределено О. Подождите, пока результаты будут сохранены...
Выбор страт«
Кол-во объектов: 8 <♦> респондент<а/ов>. 5 (~) респондент(а/ов>. 1 <Г)> респондент<а/ов>.
0 <?> респондент<а/ов>.
Кол-во полученных гипотез!
1 <+> гипотез(ы)... 0 <->гипотез<ы>. . . 0 <0> гипотез(ы).. .
Результат проверки аксиомы каузальной полноты (степени объясняемое™ примеров полученными гипотезами> : для <+>-примеров: 0,00 для <->-примеров : 0,00 для <0>-примеров: 0,00
Обратите внимание? Приемлемое значение степени для принятия гипотез >= 0-8. Программа завершена успешно... Нажмите любую клавишу для завершения.
Ы
m
9) По окончании эксперимента вы должны увидеть сообщение «Алгоритм закончил работу». Также будет указано количество т-примеров (респонденты с оценкой эффекта, равной «неопределенно») и количество доопределенных примеров.
10) В окне будет выведено количество респондентов:
(+) - респонденты с оценкой эффекта, равной «истина», (-) - «ложь», (0) - «противоречие» (?)- «неопределенно».
11) В окне будет выведено количество полученных гипотез.
12) В окне будет выведен результат подсчета степеней объяснимости начальной базы фактов (респондентов с оценкой, отличной от «неопределенно») полученными гипотезами.
Если по какой-либо из оценок степень объяснимости меньше 0.8, то полученные гипотезы не дают надежной информации. В этом случае стоит пересмотреть выборку признаков, участвующих в эксперименте или поменять стратегию (например, использовать обратный ДСМ-метод, а не прямой).
13) Нажмите любую клавишу на клавиатуре, чтобы закрыть окно.
14) В файловой системе в той же папке, что и файл Excel, появится файл с тем же названием, но с расширением .txt. Этот файл содержит данные о полученных гипотезах. В дальнейшем оба файла понадобятся для просмотра полученного результата.
Имя I_Размер | Тип_| Изменен _
0 f7_test.txt 1 КБ Текстовый документ 24.02.2013 15;24
SJf7_test.xls 168 КБ Лист Microsoft Office Excel 97-2003 24.02.2013 15:24
4. Просмотр результатов эксперимента
4.1. Приложение «Просмотр результатов»
Доступно 2 способа загрузки программы для просмотра результатов, полученных в результате эксперимента (см. раздел 3 данного руководства).
1) Если у вас уже открыто приложение для проведения эксперимента, нажмите на синюю кнопку со стрелкой в левом верхнем углу:
Интеллектуальная система ДСМ. Предметная область - СОЦИОЛОГИЯ.
Открыть 'Просмотр результатов"
Вы увидите всплывающее окно, в котором необходимо нажать кнопку «Запустить».
Загрузка файла - предупреждение системы безопасности
Запустить или сохранить этот Файл?
Имя: viewer.hta Тип: HTML приложение, 1,77 КБ
X]
И з: E:\Files_ANNA\Aspirantura\Programs\JSM_Syst...
[ Запустить | Сохранить j Отмена
Файлы из Интернета могут быть полезны, но этот тип Файла может повредить компьютер. Если вы не доверяете источник.' запускайте и не сохраняйте этот файл. Факторы риска
2) В папке программы 18М_8у81ет_8осю1о£у откройте файл двойным щелчком мыши viewer.hta.
Имя -*■_I
£}CPP_Modules QCSS t^HTMLPages Q images javascript * circle,ico ""1 experiment, hta Г"1 mshta.exe
i ивяяая
|_^web.config
3) Приложение откроется, и вы увидите окно, разделенное на четыре зоны.
я область - СОЦИОЛОГИЯ.
-Ifflxl
Файл с исходными данными ( xls) Файл с гипотезами ( txt):
PI Виз> ализапня гипотез по "кустовому" принцип} п Внзуалвзапвя ядерных признаков (фвльтров)
Обзор | Обзор |
Q Вывод зяачеввй признаков вх текстовыми аналогами П Скрывать в дереве гипотез прнзнаки предыдущего уровня
Загрузить
| Параметры Q Признаки | Эффект | Респонденты I Гипотезы
Верхняя горизонтальная панель - это меню с настройками.
Доступно четыре настройки:
F1 Внзуалнзапня гипотез по "кастовому" припишу П Визуализация ядерных признаков (фильтров)
РП Вывод значений признаков их текстовыми аналогами Q Скрывать в дереве гипотез признаки предыдущего уровня
В левой вертикальной панели содержится информация по категориям:
> Параметры (эксперимента)
> Признаки
> Изучаемый эффект
> Респонденты
> Гипотезы
Правая средняя и нижняя панели необходимы для вывода более детальной информации в виде таблиц.
4) Все кнопки на странице выполняют некоторую функциональность.
Вы можете перемещать границы панелей.
Для этого наведите курсор мыши на границу двух соседних панелей (чтобы курсор принял форму двойной стрелки ■*->), нажмите левую кнопку мыши и потяните, чтобы настроить нужную ширину.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.