Моделирование процессов с состояниями сложной структуры на основе решеток замкнутых описаний тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Бузмаков Алексей Владимирович

  • Бузмаков Алексей Владимирович
  • кандидат науккандидат наук
  • 2015, ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ05.13.18
  • Количество страниц 154
Бузмаков Алексей Владимирович. Моделирование процессов с состояниями сложной структуры на основе решеток замкнутых описаний: дис. кандидат наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики». 2015. 154 с.

Оглавление диссертации кандидат наук Бузмаков Алексей Владимирович

Введение

1 Возможные подходы к моделированию процессов с состояниями сложной структурой

1.1 Введение

1.2 Процессы с состояниями сложной структуры

1.3 Плоские модели

1.4 Модели последовательностей

1.5 Графовые модели

1.6 Методы оценки качества моделей

1.7 Заключение

2 Модель процессов с состояниями сложной структуры на основе узорных структур

2.1 Введение

2.2 Базовые понятия

2.2.1 Элементы теории решёток

2.2.2 Анализ формальных понятий (АФП)

2.2.3 Узорные структуры

2.3 Проекции как средство приближенного анализа

2.4 Узорные структуры для процессов

2.4.1 Рабочий пример

2.4.2 Частичный порядок на последовательностях и соответствующая полурешётка

2.4.3 Проекции узорных структур на последовательностях

2.4.4 Алгоритм расчёта решёточной операции на

сплошных последовательностях

2.5 Заключение

3 Меры качества моделей и их применение

3.1 Введение

3.2 Устойчивость формальных понятий

3.2.1 Определение устойчивости

3.2.2 Оценки устойчивости

3.3 Особенности расчёта устойчивости и её оценок

3.4 Исследование поведения меры устойчивости формального понятия и её оценок

3.4.1 Схема эксперимента

3.4.2 Общее поведение устойчивости

3.4.3 Порог устойчивых понятий

3.4.4 Ранжирование понятий по устойчивости

3.4.5 Ограничения данной схемы экспериментов

3.5 Сравнение меры устойчивости и её оценок с другими мерами качества моделей

3.5.1 Рабочий пример

3.5.2 Мера рычага

3.5.3 Схема эксперимента

3.5.4 Результаты эксперимента

3.6 Эффективность оценок устойчивости

3.6.1 Точность оценки устойчивости

3.6.2 Оценка устойчивости и ранжирование

3.6.3 Устойчивость и интервал оценки

3.7 Заключение

4 Алгоритмы и комплексы программ, реализующие модели на основе решёток замкнутых описаний

4.1 Введение

4.2 Адаптация существующих АФП алгоритмов для работы с узорными структурами

4.3 Программный комплекс для моделирования на основе узорных структур

4.3.1 Форматы передачи данных

4.3.2 Архитектура подхода

4.3.3 Менеджер узоров

4.3.4 Подсистемы хранения объёмов и содержаний

4.3.5 Подсистема построения узорной решётки

4.3.6 Моделирование процессов с состояниями сложной структуры

4.3.7 Интеграция с программным комплексом FCART

4.3.8 Комплексы программ для работы с узорными структурам и АФП

4.4 Заключение

5 Построение и использование моделей процессов с состояниями сложной структуры на реальных данных

5.1 Введение

5.2 Моделирование посещения новостных ресурсов пользователями

5.3 Моделирование процесса госпитализации пациентов

5.3.1 Наивный подход моделирования процессов госпитализации

5.3.2 Моделирование процессов госпитализации с учётом сложного описания состояний

5.3.3 Использование других подходов для моделирования процесса госпитализации пациентов

5.4 Заключение

Заключение

Литература

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Моделирование процессов с состояниями сложной структуры на основе решеток замкнутых описаний»

Введение

Актуальность темы. Многие явления окружающего мира могут быть представлены процессами. Например, развитие болезни пациента характеризуется изменением состояния больного, происходящего в том числе под воздействием применяемого подхода к его лечению. При моделировании процессов только некоторые особенности состояний могут быть зафиксированы и обработаны. Последовательности зафиксированных состояний называются реализациями процесса, а всё множество доступных реализаций процесса называется его логом. Таким образом, располагая логами процесса, можно построить его модель, которая может быть использована для решения различных задач, таких как экспертный анализ процесса, а также классификация и кластеризация новых реализаций процесса. В этой работе мы фокусируемся на задаче автоматического построения модели процесса для её последующего анализа экспертом. Например, для задачи анализа процесса госпитализаций пациентов одна реализация может состоять из состояний, каждое из которых описывается рядом параметров, таких как, расположение больницы, применяемые медицинские процедуры, продолжительность госпитализации и др. Модель, построенная по логу процесса госпитализации, может быть использована экспертом для различных стоящих перед ним задач, таких как оптимизация процесса лечения по качеству или скорости, поиск систематических ошибок процесса.

За последнее десятилетие было проведено много исследования моделей процессов и методов их построения с акцентом на события, такие как сети Петри, Yawl и другие [3]. В этих работах под событиями понимаются переходы из одного состояния в другое. Структура

же самих событий в этих работах не рассматривается. В этой работе мы фокусируемся именно на состояниях процесса, в то время как переходы между ними рассматриваются просто как временные отношения следования. Более того, в этой работе мы рассматриваем процессы с состояниями сложной структуры, что подчёркивает тот факт, что одно состояние описывается многими параметрами разной природы. В частности, для процесса госпитализации пациентов одно состояние описывается среди прочих параметров не просто именем больницы, но также и таксономией больниц по территориальному расположению - древовидной структурой, задающей отношение частное-общее, в которой также присутствуют больницы "обобщённого" вида, такие как "все больницы определённого города". Это позволяет включить в модель как можно более полный лог процесса, что помогает строить модель процесса госпитализации с "обобщением" некоторых параметров, и, таким образом, предоставляет эксперту возможность более подробно исследовать процесс госпитализации.

Для моделей таких процессов могут быть применены различные подходы [33; 99], которые ищут частые последовательности в логе процесса, при этом структура одного элемента последовательности может включать несколько компонент, для каждой из которых задана таксономия. К сожалению, в этих подходах нельзя передать такую важную информацию, как количество повторений определённой процедуры, например, химиотерапии. И, более того, эффективность этих подходов невысокая, при условии, что многие из порождаемых элементарных моделей имеют малую пользу для эксперта. Другим возможным подходом к анализу таких данных является работа [114], в которой авторы на основе статистических методов отображают данные, собранные в больницах. Однако данная работа не фокусируется на последовательных зависимостях, и в ней такие зависимости имеют очень грубое представление, привязанное к конкретным временам суток.

Специфика процессов с состояниями сложной структуры требует специального типа моделей, способного представлять средства выражения сходства и различия реализаций процесса с состояниям сложной структуры. В качестве математического аппарата построения моделей процессов с состояниями сложной структуры используются решетки замкнутых описаний, представляемые так называемыми узорными структурами [40], дополненные средствами приближенного описания - проекциями описаний, позволяющим моделировать информацию о большом количестве реализаций процессов с помощью существующих эффективных алгоритмов. Этот математический аппарат позволяет находить классы реализаций процессов схожих между собой, с получением соответствующего сходства. Найденные классы реализаций процессов упорядочены по включению соответствующих множеств реализаций в каждом классе и формируют так называемую иерархическую модель процесса. Такая модель состоит из множества элементарных моделей процесса, каждая из которых описывает процесс на определённом уровне абстракции, учитывающем только часть информации доступную в логах процесса.

Таким образом, объектом исследования являются различные процессы с состояниями сложной структуры. Предметом исследования являются математическая модель, алгоритмы её построения и комплекс программ анализа процессов с состояниями сложной структуры с целью экспертного анализа этого процесса для его оптимизации и поиска ошибок.

Целью диссертационного исследования является разработка подходов к построению моделей процессов с состояниями сложной структуры на основе решёток замкнутых описаний. Модели должны строиться за приемлемое время и иметь размер адекватный для экспертного анализа.

В соответствии с целью исследования были поставлены следующие задачи:

Предложить иерархическую модель процессов с состояниями сложной структуры, которую можно построить за приемлемое время, с целью дальнейшего экспертного анализа.

2. Предложить адекватную, эффективно вычислимую меру качества элементарных моделей процессов с состояниями сложной структуры с целью уменьшения сложности иерархической модели таких процессов.

3. Разработать комплекс программ для анализа процессов с состояниями сложной структуры на основе предложенной модели и апробировать его на данных о процессах госпитализации пациентов.

Следующие особенности работы определяют её научную новизну:

1. Предложен класс моделей на основе узорных структур для исследования процессов с состояниями сложной структуры.

2. Подход к моделированию на основе решеток замкнутых описаний был обобщён на более широкий класс проекций описаний, имеющих высокую практическую значимость. Это позволило автоматически строить модели введённого класса за меньшее время, чем при использовании альтернативных подходов.

3. Впервые для измерения качества элементарных моделей была экспериментально проверена на широкой тестовой базе данных возможность применения меры качества по устойчивости.

4. Были предложены две эффективные оценки устойчивости, которые имеют лучшие вычислительные характеристики и точность, чем существующие аналоги.

5. Впервые создан комплекс программ, позволяющий разрабатывать модели на основе решеток замкнутых описаний, в рамках которого была реализована модель процессов с состояниями

сложной структуры. Эта модель была апробирована на процессе госпитализации пациентов.

Теоретическая ценность данной работы состоит

1. в расширении и уточнении аппарата узорных структур для моделирования процессов с состояниями сложной структуры;

2. во введении и исследовании проекции минимальной длины и алфавитной проекции моделей процессов с состояниями сложной структуры;

3. во введении и исследовании эффективных оценок устойчивости элементарных моделей на основе замкнутых описаний.

Практическая ценность работы состоит

1. в разработке класса моделей процессов с состояниями сложной структуры;

2. в разработке быстрых алгоритмов вычисления мер качества элементарных моделей при создание иерархических моделей на основе аппарата узорных структур;

3. в получении значимых результатов исследования процессов госпитализаций для оптимизации процессов лечения;

4. в разработке эффективного программного комплекса, который предоставляет возможность использования методов решеток замкнутых описаний для построения моделей процессов с состояниями сложной структуры.

Положения, выносимые на защиту:

1. Предложен класс иерархических моделей процессов с состояниями сложной структуры и вычислительные методы автоматического построения таких моделей по логу процессов за приемлемое время с учетом специфики предметной области.

2. Аппарат узорных структур и их проекций был расширен на более широкий класс проекций.

3. Экспериментально обоснована возможность применения меры качества устойчивости для выделения важных элементарных моделей в задаче упрощения разработанной иерархической модели процессов с состояниями сложной структуры.

4. Введены две эффективные оценки меры качества устойчивости и экспериментально обоснована возможность их успешного применения.

5. Разработан комплекс программ для анализа процессов с состояниями сложной структуры на основе решеток замкнутых описаний (узорных структур), успешно апробированный в задаче анализа госпитализаций. Разработанный комплекс программ включен в программную систему FCART.

Достоверность полученных результатов опирается на строгость использованных математических моделей и на их экспериментальное подтверждение.

Апробация работы. Основные результаты работы обсуждались и докладывались на следующих конференциях:

1. Симпозиум BioIntelligence 2012, Софи-Антиполис, Франция;

2. Первый международный семинар "Что АФП может сделать для искусственного интеллекта?" (Workshop: What can FCA do for Artificial Intelligence?), 2012, Монпелье, Франция;

3. Девятая международная конференция по решёткам понятий и их приложениям (The Ninth International Conference on Concept Lattices and Their Applications), 2012, Малага, Испания;

4. Симпозиум BioIntelligence 2013, Софи-Антиполис, Франция;

5. Второй международный семинар "Что АФП может сделать для искусственного интеллекта?" (Workshop: What can FCA do for Artificial Intelligence?), 2013, Пекин, Китай (два доклада);

6. Семинар на ECML/PKDD 2013: языки для анализа данных и машинного обучения (ECML/PKDD 2013 Workshop: Languages for Data Mining and Machine Learning), 2013, Прага, Чехия

7. Десятая международная конференция по решёткам понятий и их приложениям (The Tenth International Conference on Concept Lattices and Their Applications), 2013, Ла-Рошель, Франция;

8. Вторая международная конференция по информационным технологиям и численному управления (The Second International Conference on Information Technology and Quantitative Management), 2014, Москва, Россия.

9. Двенадцатая международная конференция по анализу формальных понятий (12th International Conference on Formal Concept Analysis), 2014, Клуж-Напока, Румыния;

Публикации. Основные результаты по теме диссертации изложены в 8 научных работах, 2 из которых изданы в изданиях, рекомендованных ВАК, 6 — в рецензируемых трудах международных конференций.

Диссертация состоит из введения, 5 глав, заключения и списка литературы.

В главе 1 приводится обзор методов анализа структурных данных. Такие как плоские и иерархические модели анализа процессов, а также графовые методы обработки структурной информации.

В главе 2 вводятся иерархическая модель процессов с состояниями сложной структуры и основные математические методы, используемые в этой модели. Сначала приводятся базовые понятия теории решёток, АФП, узорных структур, за которыми следует обобщённый математический аппарат проекций. Затем данный математический

аппарат применяется для анализа данных, представленных последовательностями со сложными элементы, которые моделируют процесс с состояниями сложной структуры. Для моделирования таких процессов в конце этой главы вводятся специальные типы проекций.

Глава 3 посвящена выделению важных элементарных моделей из иерархической, что позволяет сушественно уменьшить размер иерархической модели до адекватного уровня при экспертном анализе. В этой главе обосновывается, что мера качества по устойчивости может быть эффективно применёна для решения такой задачи, а также вводятся и исследуются два метода эффективной её оценки. Также в этой главе обсуждаются вопросы численных методов расчёта устойчивости и её оценок.

Далее в главе 4 описываются особенности расчёта данной модели в рамках комплекса программ, в рамках которого введённая модель может эффективно рассчитываться и применяться. Также в этой главе описывается интеграция разработанной системы с программным комплексом БСЛЯТ, являющимся одним из лучших комплексов для исследования различных явлений с помощью анализа формальных понятий.

Перед заключением в главе 5 приводятся результаты экспериментов, посвящённых использованию разработанной системы для анализа процесса госпитализации. В данной главе описывается, как разработанная модель может помочь эксперту ответить на его вопросы и рассматриваются некоторые элементарные модели, полученные из иерархиеской модели процесса.

Глава 1

Возможные подходы к моделированию процессов с состояниями сложной структурой

1.1 Введение

В этой главе мы задаемся вопросом какие подходы могут быть использованы для анализа процессов с состояниями сложной структуры? Прежде всего необходимо определить какие процессы мы исследуем и затем посмотреть, какие существуют подходы к моделированию процессов как таковых. К таким подходам следует отнести плоские и иерархические модели. К плоским моделям относят сети Петри, системы переходов и другие классы общих схем процессов, то есть таких схем, на которых показано общее поведение процесса, и по которым можно смоделировать большую часть реализаций процессов.

Иерархические модели включают упорядоченное множество простых моделей. Это может быть как иерархия сетей Петри, так и упорядоченные множества закономерностей, называемых также элементарными моделями, получаемые методами анализа данных. В этом случае, как правило, используются методы анализа последовательностей. Количество найденных таким образом элементарных моделей может быть существенно и необходима последующая фильтрация для возможности экспертного анализа такой модели. Соответствен-

но меры качества элементарных моделей имеют важное значения для значимых иерархических моделей.

Однако, большинство таких моделей не всегда могут передать сложную структуру состояний. Тогда естественным подходом к моделированию процессов с состояниям сложной структуры является графовое представление процесса, которое также будет рассмотрено.

Таким образом, в этой главе мы сначала рассмотрим подробнее процесс с состояниями сложной структуры, а затем будут рассмотрены плоские и иерархические модели, за которым последует обсуждение подходов к обработке графов для анализа процессов с состояниями сложной структуры. В самом конце мы рассмотрим различные меры качества элементарных моделей, позволяющие редуцировать иерархические модели без потери качества.

1.2 Процессы с состояниями сложной структуры

В реальной жизни процессом называется некоторое скрытое явление, которое в реальной жизни проявляется как последовательности однотипных взаимосвязанных (предполагаемых взаимосвязанными) фактов. Каждая такая последовательность взаимосвязанных фактов называется реализацией этого процесса, а каждый факт называется его состоянием. Процесс порождает множество своих реализаций.

Например, процесс госпитализации пациентов связан с многими скрытыми факторами, такими как реакции организма на патологии и медикаментозное лечение, различные поведенческие установки индивидуума, методология лечения и многое другое. Каждая реализация этого процесса представлена историей госпитализации отдельного пациента. Состоянием этого процесса является одна госпитализация. Такие состояния в одной реализации процесса взаимосвязаны через реакции организма конкретного пациента и методы его лечения.

В данной работе мы говорим о процессах с состояниями сложной структуры, что означает, что о каждом состоянии нам известно

не только его название, такое как "госпитализация для прохождения химиотерапии" или "госпитализация для диагностики рака", но и другая информация, отражающая взаимозависимости между состояниями. Эти взаимосвязи позволяют нам говорить об обобщённых состояниях и обобщённых реализациях процесса. В таких состояниях часть из доступной информации не рассматривается, но они чаще встречаются в реализациях процесса. Например, состояние "госпитализация территориально расположенная в московской области" является обобщённым состояниям для "госпитализация территориально расположенная в Москве", так как последнее состояние предполагает, что оно также является и первым состояниям, но не наоборот.

Таким образом, реализации процессов с состояниями сложной структуры описываются последовательностями элементов некоторого частично-упорядоченного множества состояний. Этот частичный порядок на множестве состояний представляет отношение типа "быть более общим чем"или "быть частью". Таким образом, реализация процесса с состояниями сложной структуры - это элемент Р* (слово в алфавите Р), где (Р, <) - некоторое частично-упорядоченное множество.

1.3 Плоские модели

Существует несколько плоских моделей, которые могут быть созданы методами анализа процессов. К таким моделям относятся: системы переходов и Петри-сети [3], WF-сети (частный случай Петри-ситей, используемый для моделирования бизнес процессов) [4], YAWL [111], BPMN [124], EPC [104]. Эти модели обладают разной степенью выразительности, в частности, системы переходов не могут выразить конкурентных состояний в процессе. Большинство этих моделей может быть достаточно просто преобразовано друг в друга, когда это допускают средства выразительности. Например, сети Петри могут быть легко преобразованы в BPMN [6].

На данный момент существует несколько обзорных статей, описывающих анализ процессов [3; 32]. Они выделяют альфа-алгоритм [6], как один из первых подходов к построению моделей, который может обрабатывать конкурентные состояния. Данный алгоритм анализирует отношение предшествования между любыми двумя элементами в реализациях процесса. Так может быть найдено, что один элемент всегда следует за другим, они оба следуют друг за другом, либо никогда не встречаются в одной реализации процесса. На основании чего создаются исключающие события, параллельные события или ветвление. Этот алгоритм строит сеть Петри. Существует несколько его расширений, которые позволяют получить WF-сеть, т.е. Петри-сеть, в которых в частности отсутствуют дубликаты и подвешенные состояния [6]. Альфа-алгоритм строит достоверную модель процесса в случае, когда содержаться все возможные реализации процесса, и не содержится шумов.

Среди всех алгоритмов построения моделей процессов можно выделить подходы, которые выделяют некоторые "отпечатки" реализаций процессов [14; 22; 122; 121; 123]. Также в эту группу следует отнести подходы [119; 120], которые в отличие от предыдущих используют поддержку (количество реализаций процесса, описываемых той или иной частью модели), что позволяет им бороться с шумами в данных, описывающих процесс. Именно к таким алгоритмам относится альфа-алгоритм. В частности для него "отпечатком" является отношение следования для разных состояний процесса.

К другой группе алгоритмов относятся двух-проходные алгоритмы, которые сначала строят простую модуль процесса, а затем используют её для создания более сложной модели, с большей выразительностью. Примерами простых моделей могут служить марковские цепи и системы переходов. Так, например, алгоритм [7] строит сначала систему переходов, которую затем преобразует в Петри-сеть, в которой уже возможно выразить конкурентные состояния.

Третью группу подходов образуют алгоритмы, основанные на методах искусственного интеллекта, в том числе на генетическом про-

граммировании, нейроных сетях, размытых и грубых множествах и так далее. Например, в подходе [85] авторы используют генетическое программирование для получения модели процесса. Каждая модель соответствует одному индивиду. Жизнеспособность индивида задаётся через его возможность моделирования всех реализаций процесса. На каждой итерации лучшие индивиды скрещиваются, с введением случайных мутаций. Таким образом качество модели от популяции к популяции возрастает. Процесс останавливается, когда будет получена модель с хорошими характеристиками.

Для алгоритмов построения плоских моделей процесса выделяют 4 критерия качества, которые оптимизируются в разных пропорциях различными алгоритмами

• вписывание - это критерий, согласно которому, чем больше известных реализаций процесса могут быть промоделированы, тем лучше;

• точность - критерий, согласно которому, реализации, существенно отличающиеся от известных, не должны описываться моделью;

• простота - критерий, согласно которому, количество вершин и рёбер в схеме процесса должно быть минимально.

• обобщение - критерий, соответствующий обобщающей способности модели, по сути является композицией предыдущих критериев.

Общим недостатком всех рассмотренных в этом подразделе подходов является возможность обработки только простых состояний, то есть когда у каждого состояния есть только имя, но нет никаких внутренних связей между состояниями, что приводит к невозможности использования таких подходов для исследования процессов с состояниями сложной структуры. Более того, нет понимания того, как состояния сложной структуры могут быть переданы в рамках плоских моделей без существенного увеличения модели.

1.4 Модели последовательностей

Реализации многих процессов могут быть представлены последовательностями состояний. Соответственно в данном разделе представлены подходы к анализу данных, описываемых последовательностями. Такие методы получают множества подпоследовательностей по множеству последовательностей, называемых также выборкой. Каждое такое множество последовательностей является элементарной моделью процесса разной степени общности. Здесь такие элементарные модели мы также называем закономерностями.

Одним из первых таких подходов является работа [9]. Высокий интерес к анализу последовательностей, вызванный данными порождаемых процессами или периодическими явлениями, повлёк за собой большое количество работ по анализу таких данных. Эти подходы часто создавались, исходя из конкретной задачи, что может объяснить большой объём таких работ, но в то же время высокую практическую значимость. Большинство подходов к анализу данных, представленных последовательностями могут быть найдены в различных обзорах [38; 46; 81; 88; 95; 126; 138]. Сравнение эффективности некоторых методов по поиску частых подпоследовательностей может быть найдено в [66].

Первая работа анализа последовательностей, вводит три алгоритма: Арг1огуА11, Арг1огуБоте и Бупат1сБоте [9]. Авторы описывают пятишаговый алгоритм. Сначала они модифицируют реляционные таблицы базы данных в последовательности, затем находят частые множества признаков, описывающих одно состояние, после чего каждая последовательность описывается только частыми множествами признаков. Далее ищутся частые множества множеств признаков, соответствующие последовательностям. В заключительном этапе выбираются только максимальные последовательности. Различия между этими алгоритмами состоят в различном способе подсчёта результирующих последовательностей. Следующий подход в8Р в анализе последовательностей был введён теми же авторами [109], в

котором они обобщают предыдущий подход и добавляют ограничения на возможные последовательности. Алгоритм состоит из двух этапов:

Порождение. Порождаются все последовательности длины к+ 1, где к - это длина последовательности на данной итерации.

Отсечение. Дубликаты порождённых последовательностей удаляются из рассмотрения.

Следующим был алгоритм Р8Р [84], использовавший древесную структуру для хранение последовательностей. Для того чтобы иметь возможность учитывать пользовательские ограничение, разрабатывается поход, который позволяет устанавливать ограничения на допустимые последовательности регулярными выражениями [43]. Наряду с [109], эта работа одна из первых, которая вводит ограничения на получаемые закономерности. Наряду с полными методами, были введены неполные, порождающие лишь подмножество всех искомых последовательностей. К таким методам относятся [79; 113], в которых авторы используют отсечение ветвей поиска на основании статистических методов.

До сих пор мы рассматривали методы, имеющие горизонтальный формат хранения последовательностей. Горизонтальное представление - это такой способ представления последовательностей, для которого в выборке нужно сначала задать идентификатор объекта, а затем по идентификатору объекта можно получить его описание. Данный способ, является классическим способом представления данных и берёт своё начало из анализа объектно-признаковых транзакций [8].

Другим форматом хранения последовательностей является вертикальное представление - способ представления данных о последовательностях, в котором для каждого или некоторых структурных элементов в данных задаётся список тех объектов, описание которых включает данный структурный элемент. При таком способе представления данных требуется лишь однократный проход по выборке

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Список литературы диссертационного исследования кандидат наук Бузмаков Алексей Владимирович, 2015 год

Литература

1. Биркгоф Г. Теория решеток. — 1984. — С. 568.

2. Самохин М. В. Машинное обучение на узорных структурах : дис. ... канд. техн. наук : 05.13.17 : защищена 22.06.06 : утв. 15.04.06 / Самохин Михаил Валерьевич. — М., 2006. — 124 с. — Библиогр.: с. 113—124.

3. Aalst W. M. P. van der Process mining: Discovery, conformance and enhancement of business processes. — Springer, 2011. — Pp. I-XVI, 1-352.

4. Aalst W. M. P. van der The application of Petri nets to workflow management // J. circuits, Syst. Comput. — 1998. — Vol. 8, no. 01. — Pp. 21-66.

5. Aalst W. M. P. van der, Pesic M., Schonenberg H. Declarative workflows: Balancing between flexibility and support // Comput. Sci. Dev. — 2009. — Vol. 23, no. 2. — Pp. 99-113.

7. Aalst W. M. P. van der, Rubin V., Verbeek H. M. W., Dongen B. F. van, Kindler E., Günther C. W. Process mining: a two-step approach to balance between underletting and overfitting // Softw. Syst. Model. — 2010. — Vol. 9, no. 1. — Pp. 87-111.

6. Aalst W. M. P. van der, Weijters T., Maruster L. Workflow mining: Discovering process models from event logs // Knowl. Data Eng. IEEE Trans. — 2004. — Vol. 16, no. 9. — Pp. 1128-1142.

8. Agrawal R., Imielimki T., Swami A. Mining association rules between sets of items in large databases // ACM SIGMOD Rec. Vol. 22. — ACM. 1993. — Pp. 207-216.

9. Agrawal R., Srikant R. Mining sequential patterns // Data Eng. 1995. Proc. Elev. Int. Conf. - Mar. 1995. - Pp. 3-14.

10. Azevedo P. J., Jorge A. M. Comparing Rule Measures for Predictive Association Rules // Mach. Learn. ECML 2007. Vol. 4701 / ed. by J. N. Kok, J. Koronacki, R. L. de Mantaras, S. Matwin, D. Mladenic, A. Skowron. — Springer Berlin Heidelberg, 2007. — Pp. 510-517. — (Lecture Notes in Computer Science).

11. Babin M. A., Kuznetsov S. O. Approximating Concept Stability // Form. Concept Anal. Vol. 7278 / ed. by F. Domenach, D. Ignatov, J. Poelmans. — Springer Berlin Heidelberg, 2012. — Pp. 7-15. — (Lecture Notes in Computer Science).

12. Becker P., Hereth J., Stumme G. ToscanaJ: An Open Source Tool for Qualitative Data Analysis // Proc. Work. FCAKDD 15th Eur. Conf. Artif. Intell. (ECAI 2002). — Lyon, 2002.

13. Belohlavek R., Trnecka M. Basic Level in Formal Concept Analysis: Interesting Concepts and Psychological Ramifications // Proc. Twenty-Third Int. Jt. Conf. Artif. Intell. — AAAI Press, Aug. 2013. — Pp. 1233-1239. — (IJCAI'13).

14. Bergenthum R., Desel J., Lorenz R., Mauser S. Process mining based on regions of languages // Bus. Process Manag. — Springer, 2007. — Pp. 375-383.

15. Bissell-Siders R., Cuissart B., Cremilleux B. On the Stimulation of Patterns // Concept. Struct. From Inf. to Intell. SE - 9. Vol. 6208 / ed. by M. Croitoru, S. Ferre, D. Lukose. — Berlin, Heidelberg : Springer Berlin Heidelberg, 2010. — Pp. 56-69. — (Lecture Notes in Computer Science).

16. Bordat J.-P. Calcul pratique du treillis de Galois d'une correspondance // Mathematiques Sci. Hum. — 1986. — Vol. 96. — Pp. 3147.

17. Borgelt C., Berthold M. Mining molecular fragments: finding relevant substructures of molecules // 2002 IEEE Int. Conf. Data Mining, 2002. Proceedings. — IEEE Comput. Soc, 2002. — Pp. 51-58.

18. Borgelt C. Graph Mining: An Overview // Proc. 19th GMA/GI Work. Comput. Intell. — Witten-Bommerholz, Germany : Uni-versitatskolleg Bommerholz, 2009. — Pp. 189-203.

19. Borgelt C., Meinl T. Full Perfect Extension Pruning for Frequent Subgraph Mining // Min. Complex Data SE - 11. Vol. 165 / ed. by D. Zighed, S. Tsumoto, Z. Ras, H. Hacid. — Springer Berlin Heidelberg, 2009. — Pp. 189-205. — (Studies in Computational Intelligence).

20. Borza P., Sabou O., Sacarea C. OpenFCA, an open source formal concept analysis toolbox // Proc. IEEE Int. Conf. Autom. Qual. Test. Robot. — 2010. — Pp. 1-5.

21. Buzmakov A., Egho E., Jay N., Kuznetsov S. O., Napoli A., Rai'ssi C. The representation of sequential patterns and their projections within Formal Concept Analysis // Work. Notes LML. — 2013. — Pp. 65-79.

22. Carmona J., Cortadella J.Process mining meets abstract interpretation // Mach. Learn. Knowl. Discov. Databases. — Springer, 2010. — Pp. 184-199.

23. Carvalho D. R., Freitas A. A., Ebecken N. Evaluating the Correlation Between Objective Rule Interestingness Measures and Real Human Interest // Knowl. Discov. Databases PKDD 2005. Vol. 3721 / ed. by A. M. Jorge, L. Torgo, P. Brazdil, R. Camacho, J. Gama. — Springer Berlin Heidelberg, 2005. — Pp. 453-461. — (Lecture Notes in Computer Science).

24. Casas-Garriga G. Summarizing Sequential Data with Closed Partial Orders. // Proc. 5th SIAM Int'l Conf. Data Min. — 2005.

25. Ceglar A., Roddick J. F. Association Mining // ACM Comput. Surv. — New York, NY, USA, 2006. — Vol. 38, no. 2.

26. Cook D. J., Holder L. B. Substructure discovery using minimum description length and background knowledge // J. Artif. Intell. Res. — 1994. — Vol. 1. — Pp. 231-255.

27. Coulet A., Domenach F., Kaytoue M., Napoli A. Using Pattern Structures for Analyzing Ontology-Based Annotations of Biomedical Data // Form. Concept Anal. SE - 5. Vol. 7880 / ed. by P. Cellier, F. Distel, B. Ganter. — Springer Berlin Heidelberg, 2013. — Pp. 76-91. — (Lecture Notes in Computer Science).

28. Davey B. A., Priestley H. A. Introduction to Lattices and Order. — Cambridge University Press, 2002. — (Cambridge mathematical text books).

29. Deshpande M., Kuramochi M., Wale N., Karapis G. Frequent substructure-based approaches for classifying chemical compounds // IEEE Trans. Knowl. Data Eng. — 2005. — Aug. — Vol. 17, no. 8. — Pp. 1036-1050.

30. Ding B, Lo D, Han J., Khoo S.-C. Efficient Mining of Closed Repetitive Gapped Subsequences from a Sequence Database // Proc. IEEE 25th Int. Conf. Data Eng. — IEEE, Mar. 2009. — Pp. 1024-1035.

31. Dong G., Li J. Efficient mining of emerging patterns: Discovering trends and differences // Proc. fifth ACM SIGKDD Int. Conf. Knowl. Discov. data Min. — New York : ACM, 1999. — Pp. 4352. — (KDD '99).

32. Dongen B. F. van, De Medeiros A. K. A., Wen L. Process mining: Overview and outlook of petri net discovery algorithms // Trans. Petri Nets Other Model. Concurr. II. — Springer, 2009. — Pp. 225-242.

33. Egho E., Jay N., Raissi C., Ienco D., Poncelet P, Teisseire M., Napoli A. A contribution to the discovery of multidimensional patterns in healthcare trajectories // J. Intell. Inf. Syst. — 2014. — Vol. 42, no. 2. — Pp. 283-305.

34. Egho E., Jay N., Raissi C., Napoli A. A FCA-based analysis of sequential care trajectories // 8th Int. Conf. concept lattices their Appl. —2011. — Pp. 363-376.

35. Erne M. Einführung in die Ordnungstheorie. — Mannheim : Bibliographisches Institut - Wissenschaftsverlag, 1982.

36. Fetter R. B., Shin Y., Freeman J. L., Averill R. F., Thompson J. D. Case mix definition by diagnosis-related groups. // Med Care. — 1980. — Feb. — Vol. 18, no. 2. — Pp. 1-53.

37. Frank A., Asuncion A. UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. — University of California, Irvine, School of Information, Computer Sciences, 2010.

38. Fu T.-c. A review on time series data mining // Eng. Appl. Artif. Intell. — 2011. — Feb. — Vol. 24, no. 1. — Pp. 164-181.

39. Ganter B. Two basic algorithms in concept analysis. Vol. 5986 / ed. by L. Kwuida, B. Sertkaya. — Springer, 2010. — Pp. 312340. — (Lecture Notes in Computer Science).

42. Ganter B., Grigoriev P. A., Kuznetsov S. O., Samokhin M. V. Concept-Based Data Mining with Scaled Labeled Graphs // Concept. Struct. Work SE - 6. Vol. 3127 / ed. by K. Wolff, H. Pfeiffer, H. Delugach. — Springer Berlin Heidelberg, 2004. — Pp. 94-108. — (Lecture Notes in Computer Science).

40. Ganter B., Kuznetsov S. Pattern Structures and Their Projections // Concept. Struct. Broadening Base. Vol. 2120 / ed. by H. Delugach, G. Stumme. — Springer Berlin Heidelberg, 2001. — Pp. 129-142. — (Lecture Notes in Computer Science).

41. Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. — 1st. — Springer, 1999. — Pp. I-X, 1-284.

43. Garofalakis M. N., Rastogi R., Shim K. SPIRIT: Sequential pattern mining with regular expression constraints // VLDB. Vol. 99. —

1999. — Pp. 7-10.

46. Han J., Cheng H., Xin D., Yan X.Frequent pattern mining: current status and future directions // Data Min. Knowl. Discov. — 2007. — Jan. — Vol. 15, no. 1. — Pp. 55-86.

44. Han J., Pei J. Mining frequent patterns by pattern-growth: methodology and implications // ACM SIGKDD Explor. Newsl. — 2000. — Vol. 2, no. 2. — Pp. 14-20.

45. Han J., Pei J., Mortazavi-Asl B., Chen Q., Dayal U., Hsu M. FreeSpan: frequent pattern-projected sequential pattern mining // Proc. 6th ACM SIGKDD Int'l Conf. Knowl. Discov. data Min. —

2000. — Pp. 355-359.

49. Hasan M. A., Chaoji V., Salem S., Besson J., Zaki M. J. ORIGAMI: Mining Representative Orthogonal Graph Patterns // Seventh IEEE Int. Conf. Data Min. (ICDM 2007). — IEEE, Oct. 2007. — Pp. 153-162.

47. Hasan M. A., Zaki M. J. Output space sampling for graph patterns // Proc. VLDB Endow. — 2009. — Aug. — Vol. 2, no. 1. — Pp. 730-741.

48. Hasan M. A., Zaki M. J. MUSK: Uniform Sampling of k Maximal Patterns // Proc. SDM. — 2009. — Pp. 650-661.

50. Huan J., Wang W., Prins J. Efficient mining of frequent subgraphs in the presence of isomorphism // Proc. 3rd IEEE Int. Conf. Data Mining, 2003. ICDM 2003. — 2003. — Pp. 549-552.

51. Huan J., Wang W., Prins J., Yang J. SPIN: mining maximal frequent subgraphs from graph databases // Proc. 2004 ACM SIGKDD Int. Conf. Knowl. Discov. data Min. - KDD '04. — New York, New York, USA : ACM Press, Aug. 2004. — P. 581.

52. Huang K.-Y., Chang C.-H., Lin K.-Z. Prowl: An efficient frequent continuity mining algorithm on event sequences // Data Warehous. Knowl. Discov. — Springer, 2004. — Pp. 351-360.

53. Jay N., Kohler F., Napoli A. Analysis of Social Communities with Iceberg and Stability-Based Concept Lattices // Form. Concept Anal. Vol. 4933 / ed. by R. Medina, S. Obiedkov. — Springer Berlin Heidelberg, 2008. — Pp. 258-272. — (Lecture Notes in Computer Science).

54. Jiang C., Coenen F., Zito M. A survey of frequent subgraph mining algorithms // Knowl. Eng. Rev. — 2013. — Vol. 28, no. 01. — Pp. 75-105. — (The Knowledge Engineering Review).

55. Jianyong Wang, Zhiping Zeng, Lizhu Zhou CLAN: An Algorithm for Mining Closed Cliques from Large Dense Graph Databases // 22nd Int. Conf. Data Eng. — IEEE, 2006. — Pp. 73-73.

56. Jin N., Young C., Wang W. GAIA: graph classification using evolutionary computation // Proc. 2010 Int. Conf. Manag. data

- SIGMOD '10. — New York, NY, USA : ACM Press, June

2010. — Pp. 879-890. — (SIGMOD '10).

57. Jin N., Young C., Wang W. Graph classification based on pattern co-occurrence//Proceeding 18th ACM Conf. Inf. Knowl. Manag.

- CIKM '09. — New York, New York, USA : ACM Press, Nov. 2009. — P. 573.

58. Kaiser T. B., Schmidt S. E. Some Remarks on the Relation between Annotated Ordered Sets and Pattern Structures // Pattern Recognit. Mach. Intell. SE - 9. Vol. 6744 / ed. by S. Kuznetsov, D. Mandal, M. Kundu, S. Pal. — Springer Berlin Heidelberg,

2011. — Pp. 43-48. — (Lecture Notes in Computer Science ; x).

60. Kaytoue M., Kuznetsov S. O., Napoli A., Duplessis S. Mining gene expression data with pattern structures in formal concept analysis // Inf. Sci. (Ny). — 2011. — Vol. 181, no. 10. — Pp. 1989-2001.

59. Kaytoue M., Kuznetsov S., Napoli A. Biclustering Numerical Data in Formal Concept Analysis // Form. Concept Anal. Vol. 6628 / ed. by P. Valtchev, R. Jaschke. — Springer Berlin Heidelberg, 2011. — Pp. 135-150. — (Lecture Notes in Computer Science).

61. Kaytoue M., Marcuola F., Napoli A., Szathmary L., Villerd J. The Coron System. Proc. of the 8th Intl. Conference on Formal Concept Analysis (ICFCA 2010) // Proc. 8th Intl. Conf. Form. Concept Anal. (ICFCA 2010). — 2010. — Pp. 55-58.

62. King R., Srinivasan A., Dehaspe L. Warmr: a data mining tool for chemical data // J. Comput. Aided. Mol. Des. — 2001. — Vol. 15, no. 2. — Pp. 173-181.

63. Klimushkin M., Obiedkov S. A., Roth C. Approaches to the Selection of Relevant Concepts in the Case of Noisy Data // Proc. 8th Int. Conf. Form. Concept Anal. — Springer, 2010. — Pp. 255266. — (ICFCA'10).

64. Krajca P, Outrata J., Vychodil V. Advances in Algorithms Based on CbO. // Proc. 8th Int. Conf. Concept Lattices Their Appl. (CLA'10). — 2010. — Pp. 325-337.

65. Krishna V., Suri N., Athithan G. A comparative survey of algorithms for frequent subgraph discovery // Curr. Sci. — 2011. — Vol. 100, no. 2. — Pp. 190-198.

66. Kum H.-C., Chang J. H., Wang W. Benchmarking the effectiveness of sequential pattern mining methods // Data Knowl. Eng. — 2007. — Vol. 60, no. 1. — Pp. 30-50.

67. Kuramochi M., Karypis G. Frequent subgraph discovery // Proc. 2001 IEEE Int. Conf. Data Min. — IEEE Comput. Soc, 2001. — Pp. 313-320.

68. Kuramochi M., Karypis G. Finding Frequent Patterns in a Large Sparse Graph // Data Min. Knowl. Discov. — 2005. — Vol. 11, no. 3. — Pp. 243-271.

69. Kuramochi M., Karypis G. GREW-A Scalable Frequent Subgraph Discovery Algorithm // Proc. Fourth IEEE Int. Conf. Data Min. — Washington, DC, USA : IEEE Computer Society, 2004. — Pp. 439-442. — (ICDM '04).

70. Kuznetsov S. O. A fast algorithm for computing all intersections of objects in a finite semi-lattice // Autom. Doc. Math. Linguist. — 1993. — Vol. 27, no. 5. — Pp. 11-21.

71. Kuznetsov S. O. Computing Graph-Based Lattices from Smallest Projections // Knowl. Process. Data Anal. SE - 3. Vol. 6581 / ed. by K. Wolff, D. Palchunov, N. Zagoruiko, U. Andelfinger. — Berlin, Heidelberg : Springer Berlin Heidelberg, 2011. — Pp. 3547. — (Lecture Notes in Computer Science).

72. Kuznetsov S. O. Learning of Simple Conceptual Graphs from Positive and Negative Examples // Princ. Data Min. Knowl. Discov. SE - 47. Vol. 1704 / ed. by J. Zytkow, J. Rauch. — Springer Berlin Heidelberg, 1999. — Pp. 384-391. — (Lecture Notes in Computer Science).

73. Kuznetsov S. O. Mathematical aspects of concept analysis // J. Math. Sci. — 1996. — Vol. 80, no. 2. — Pp. 1654-1698.

74. Kuznetsov S. O. On stability of a formal concept // Ann. Math. Artif. Intell. — 2007. — Vol. 49, 1-4. — Pp. 101-115.

75. Kuznetsov S. O. Stability as an Estimate of the Degree of Substantiation of Hypotheses on the Basis of Operational Similarity // Autom. Doc. Math. Linguist. (Nauch. Tekh. Inf. Ser. 2). — 1990. — Vol. 24, no. 6. — Pp. 62-75.

76. Kuznetsov S. O., Samokhin M. V. Learning Closed Sets of Labeled Graphs for Chemical Applications // Inductive Log. Program. SE - 12. Vol. 3625 / ed. by S. Kramer, B. Pfahringer. — Lecture No. — Springer Berlin Heidelberg, 2005. — Pp. 190-208. — (Lecture Notes in Computer Science).

77. Kuznetsov S., Obiedkov S., Roth C. Reducing the Representation Complexity of Lattice-Based Taxonomies // Concept. Struct. Knowl. Archit. Smart Appl. Vol. 4604 / ed. by U. Priss, S. Polov-ina, R. Hill. — Springer Berlin Heidelberg, 2007. — Pp. 241254. — (Lecture Notes in Computer Science).

78. Lam W. W. M., Chan K. C. C. Discovering Interesting Molecular Substructures for Molecular Classification // IEEE Trans. Nanobioscience. — 2010. — June. — Vol. 9, no. 2. — Pp. 77-89.

79. Laur P. A., Symphor J. E., Nock R., Poncelet P. Mining sequential patterns on data streams: A near-optimal statistical approach // Proceedigns 2 nd Int. Work. Knowl. Discov. from Data Streams. — 2005.

80. Lozano S., Poezevara G., Halm-Lemeille M.-P., Lescot-Fontaine E., Lepailleur A., Bissell-Siders R., Cremilleux B., Rault S., Cuis-sart B., Bureau R. Introduction of jumping fragments in combination with QSARs for the assessment of classification in ecotoxi-cology. // J. Chem. Inf. Model. — 2010. — Vol. 50, no. 8. — Pp. 1330-1339.

81. Mabroukeh N. R., Ezeife C. I. A Taxonomy of Sequential Pattern Mining Algorithms // ACM Comput. Surv. — New York, NY, USA, 2010. — Vol. 43, no. 1. — 3:1-3:41.

82. Mannila H., Toivonen H. Discovering Generalized Episodes Using Minimal Occurrences. // KDD. Vol. 96. — 1996. — Pp. 146-151.

83. Mannila H., Toivonen H., Verkamo A. I. Discovering frequent episodes in sequences Extended abstract // 1st Conf. Knowl. Discov. Data Mining, Montr. CA. — 1995.

84. Masseglia F, Cathala F, Poncelet P. The psp approach for mining sequential patterns // Princ. Data Min. Knowl. Discov. — Springer, 1998. — Pp. 176-184.

85. Medeiros A. K., Weijters A. J., Aalst W. M. P. Genetic process mining: an experimental evaluation // Data Min. Knowl. Discov. — 2007. — Vol. 14, no. 2. — Pp. 245-304.

86. Meinl T., Borgelt C., Berthold M. R. Discriminative closed fragment mining and perfect extensions in MoFa // Proc. 2nd Start. AI Res. Symp. (STAIRS 2004, Val. Spain). — 2004. — Pp. 3-14.

87. Merwe D. V. D., Obiedkov S., Kourie D. AddIntent: A new incremental algorithm for constructing concept lattices // Concept Lattices. Vol. 2961 / ed. by G. Goos, J. Hartmanis, J. Leeuwen, P. Eklund. — Springer, 2004. — Pp. 372-385.

88. Mooney C. H., Roddick J. F. Sequential pattern mining - approaches and algorithms // ACM Comput. Surv. — 2013. — Feb. — Vol. 45, no. 2. — Pp. 1-39.

89. Neznanov A. A., Ilvovsky D. A., Kuznetsov S. O. FCART: A New FCA-based System for Data Analysis and Knowledge Discovery // Proc. Work. FCA Tools Appl. (at ICFCA'2013). — 2013.

90. Nijssen S., Kok J.The Gaston Tool for Frequent Subgraph Mining // Electron. Notes Theor. Comput. Sci. — 2005. — Mar. — Vol. 127, no. 1. — Pp. 77-87.

91. Nijssen S., Kok J. Faster association rules for multiple relations // Int. Jt. Conf. Artif. Intell. Vol. 17. — Citeseer. 2001. — Pp. 891-896.

92. Norris E. M. An algorithm for computing the maximal rectangles in a binary relation // Rev. Roum. Math{e}matiques Pures Appliqu{e}es. — 1978. — Vol. 23, no. 2. — Pp. 243-250.

93. Orlando S., Perego R., Silvestri C. A new algorithm for gap constrained sequence mining // Proc. 2004 ACM Symp. Appl. Com-put. — ACM. 2004. — Pp. 540-547.

94. Papadopoulos A. N., Lyritsis A., Manolopoulos Y. SkyGraph: an algorithm for important subgraph discovery in relational graphs // Data Min. Knowl. Discov. — 2008. — July. — Vol. 17, no. 1. — Pp. 57-76.

96. Pei J., Han J., Mortazavi-Asl B., Pinto H., Chen Q., Dayal U., Hsu M.-C. PrefixSpan Mining Sequential Patterns Efficiently by Prefix Projected Pattern Growth // 17th Int. Conf. Data Eng. — 2001. — Pp. 215-226.

95. Pei J., Han J., Wang W. Constraint-based sequential pattern mining: the pattern-growth methods // J. Intell. Inf. Syst. — 2007. — Vol. 28, no. 2. — Pp. 133-160.

98. Pennerath F, Niel G., Vismara P, Jauffret P., Laurenco C., Napoli A. Graph-Mining Algorithm for the Evaluation of Bond Forma-bility // J. Chem. Inf. Model. — 2010. — Vol. 50, no. 2. — Pp. 221-239.

97. Pennerath F., Polaillon G., Napoli A. Mining Intervals of Graphs to Extract Characteristic Reaction Patterns.

100. Plantevit M., Choong Y. W., Laurent A., Laurent D., Teisseire M. M2SP: Mining Sequential Patterns Among Several Dimensions // Knowl. Discov. Databases PKDD 2005. Vol. 3721 / ed. by A. M. Jorge, L. Torgo, P. Brazdil, R. Camacho, J. Gama. — Berlin, Heidelberg : Springer Berlin Heidelberg, 2005. — Pp. 205-216. — (Lecture Notes in Computer Science).

99. Plantevit M., Laurent A., Laurent D., Teisseire M., Choong Y. W. Mining multidimensional and multilevel sequential patterns // ACM Trans. Knowl. Discov. Data. — 2010. — Jan. — Vol. 4, no. 1. — Pp. 1-37.

101. Poezevara G., Cuissart B., Cremilleux B. Extracting and summarizing the frequent emerging graph patterns from a dataset of graphs // J. Intell. Inf. Syst. — 2011. — July. — Vol. 37. — Pp. 333-353.

102. Priss U. FcaStone - FCA file format conversion and interoperability software // Proc. Concept. Struct. Tool Interoperability Work. - 2008.

103. Roth C., Obiedkov S., Kourie D. G. On succinct representation of knowledge community taxonomies with formal concept analysis // Int. J. Found. Comput. Sci. - 2008. - Apr. - Vol. 19, no. 02. -Pp. 383-404.

104. Scheer A.-W. Business Process Engineering-Reference Models for Industrial Companies // Berlin al. Springer, - 1994.

105. Schietgat L., Ramon J., Bruynooghe M., Blockeel H. An Efficiently Computable Graph-Based Metric for the Classification of Small Molecules // Discov. Sci. SE - 20. Vol. 5255 / ed. by J.-F. Boulicaut, M. Berthold, T. Horvath. - Springer Berlin Heidelberg, 2008. - Pp. 197-209. - (Lecture Notes in Computer Science).

106. Seeland M., Girschick T., Buchwald F., Kramer S. Online Structural Graph Clustering Using Frequent Subgraph Mining // Mach. Learn. Knowl. Discov. Databases SE - 14. Vol. 6323 / ed. by J. Balcazar, F. Bonchi, A. Gionis, M. Sebag. - Berlin, Heidelberg : Springer Berlin Heidelberg, 2010. - Pp. 213-228. - (Lecture Notes in Computer Science).

107. Shelokar P, Quirin A., Cordon O., Cordon O. MOSubdue: a Pareto dominance-based multiobjective Subdue algorithm for frequent subgraph mining // Knowl. Inf. Syst. - 2013. - Nov. -Vol. 34, no. 1. - Pp. 75-108.

108. Soulet A., Raïssi C., Plantevit M., Cremilleux B. Mining Dominant Patterns in the Sky //2011 IEEE 11th Int. Conf. Data Min. -Vancouver, B.C, Canada : IEEE, Dec. 2011. - Pp. 655-664.

109. Srikant R., Agrawal R. Mining sequential patterns: Generalizations and performance improvements. - Springer, 1996.

110. Sun X., Orlowska M. E., Zhou X.Finding event-oriented patterns in long temporal sequences // Adv. Knowl. Discov. Data Min. — Springer, 2003. — Pp. 15-26.

111. Ter Hofstede A. H. M., Aalst W. M. P. van der, Adams M., Russell ^.Modern Business Process Automation: YAWL and its support environment. — Springer, 2009.

112. Thomas L. T., Valluri S. R., Karlapalem K. MARGIN: Maximal frequent subgraph mining // ACM Trans. Knowl. Discov. Data. —

2010. — Oct. — Vol. 4, no. 3. — Pp. 1-42.

113. Toivonen H. [et al.] Discovery of frequent patterns in large data collections. — Citeseer, 1996.

114. Tsumoto S., Iwata H., Hirano S., Tsumoto Y. Similarity-based behavior and process mining of medical practices // Futur. Gener. Comput. Syst. — 2014. — Apr. — Vol. 33. — Pp. 21-31.

115. Valtchev P, Grossser D., Roume C., Hacene M. R. 5. GALICIA: an open platform for lattices // Contrib. to 11th Intl. Conf. Concept. Struct. — 2003. — Pp. 241-254.

116. Webb G. I. Discovering Significant Patterns // Mach. Learn. — 2007. — Vol. 68, no. 1. — Pp. 1-33.

117. Webb G. I. Self-sufficient itemsets // ACM Trans. Knowl. Discov. Data. — 2010. — Jan. — Vol. 4, no. 1. — Pp. 1-20.

118. Webb G. I., Zhang S. K-Optimal Rule Discovery // Data Min. Knowl. Discov. — 2005. — Vol. 10, no. 1. — Pp. 39-79.

119. Weijters A., Ribeiro J. T. S. Flexible heuristics miner (FHM) // Comput. Intell. Data Min. (CIDM), 2011 IEEE Symp. — IEEE.

2011. — Pp. 310-317.

120. Weijters A. J. M. M., Aalst W. M. P. van der Rediscovering workflow models from event-based data using little thumb // Integr. Comput. Aided. Eng. — 2003. — Vol. 10, no. 2. — Pp. 151-162.

122. Wen L., Aalst W. M. P. van der, Wang J., Sun J. Mining process models with non-free-choice constructs // Data Min. Knowl. Discov. - 2007. - Vol. 15, no. 2. - Pp. 145-180.

121. Wen L., Wang J., Aalst W. M. P. van der, Huang B., Sun J. A novel approach for process mining based on event types // J. Intell. Inf. Syst. - 2009. - Vol. 32, no. 2. - Pp. 163-190.

123. Werf J. M. E. M. van der, Dongen B. F. van, Hurkens C. A. J., Serebrenik A. Process discovery using integer linear programming // Appl. Theory Petri Nets. - Springer, 2008. - Pp. 368387.

124. White S. A. Introduction to BPMN // IBM Coop. - 2004. -Vol. 2. -.

125. Worlein M., Meinl T., Fischer I., Philippsen M. A Quantitative Comparison of the Subgraph Miners MoFa, gSpan, FFSM, and Gaston // Knowl. Discov. Databases PKDD 2005 SE - 39. Vol. 3721 / ed. by A. Jorge, L. Torgo, P. Brazdil, R. Camacho, J. Gama. - Springer Berlin Heidelberg, 2005. - Pp. 392-403. -(Lecture Notes in Computer Science).

126. Xing Z., Pei J., Keogh E. A brief survey on sequence classification // ACM SIGKDD Explor. Newsl. - 2010. - Nov. - Vol. 12, no. 1. - P. 40.

130. Yan X., Cheng H., Han J., Yu P. S. Mining significant graph patterns by leap search // Proc. 2008 ACM SIGMOD Int. Conf. Manag. data - SIGMOD '08. - New York, New York, USA : ACM Press, June 2008. - Pp. 433-444.

127. Yan X., Han J. CloseGraph: mining closed frequent graph patterns // Proc. ninth ACM SIGKDD Int. Conf. Knowl. Discov. data Min. - New York, NY, USA : ACM, 2003. - Pp. 286295. - (KDD '03).

128. YanX., Han J.gSpan: Graph-Based Substructure Pattern Mining // Data Mining, 2002. ICDM 2003. Proceedings. ... — Dec. 2002. — P. 721.

129. Yan X., Han J., Afshar R. CloSpan: Mining Closed Sequential Patterns in Large Databases // Proc. SIAM Int'l Conf. Data Min. — 2003. — Pp. 166-177.

131. Yevtushenko S. A. System of data analysis "Concept Explorer" // Proc. 7th Natl. Conf. Artif. Intell. KII-2000. — Russia, 2000. — Pp. 127-134.

132. Zaki M., Hsiao C.-J.Efficient algorithms for mining closed itemsets and their lattice structure // IEEE Trans. Knowl. Data Eng. — 2005. — Apr. — Vol. 17, no. 4. — Pp. 462-478.

133. Zaki M. J. Efficient enumeration of frequent sequences // Proc. seventh Int. Conf. Inf. Knowl. Manag. — ACM. 1998. — Pp. 68-75.

134. Zaki M. J.Sequence mining in categorical domains: incorporating constraints // Proc. ninth Int. Conf. Inf. Knowl. Manag. — ACM. 2000. — Pp. 422-429.

135. Zaki M. SPADE: An Efficient Algorithm for Mining Frequent Sequences // Mach. Learn. — 2001. — Vol. 42, 1-2. — Pp. 31-60.

137. Zeng Z., Wang J., Zhang J., Zhou L. FOGGER : An Algorithm for Graph Generator Discovery // Proc. 12th Int. Conf. Extending Database Technol. Adv. Database Technol. - EDBT '09. — New York, New York, USA : ACM Press, Mar. 2009. — Pp. 517-528.

136. Zeng Z., Wang J., Zhou L., Karypis G. Coherent closed quasiclique discovery from large dense graph databases // Proc. 12th ACM SIGKDD Int. Conf. Knowl. Discov. data Min. - KDD '06. — New York, New York, USA : ACM Press, Aug. 2006. — P. 797.

139.

140.

Zhao Q., Bhowmick S. S. Sequential pattern mining: A survey // ITechnical Rep. CAIS Nayang Technol. Univ. Singapore. — 2003. — Pp. 1-26.

Zhu F, Yan X., Han J., Yu P. gPrune: A Constraint Pushing Framework for Graph Pattern Mining // Adv. Knowl. Discov. Data Min. SE - 38. Vol. 4426 / ed. by Z.-H. Zhou, H. Li, Q. Yang. — Springer Berlin Heidelberg, 2007. — Pp. 388-400. — (Lecture Notes in Computer Science).

Zimmermann A. Objectively evaluating interestingness measures for frequent itemset mining // Emerg. Trends Knowl. Discov. Data Mining-PAKDD 2013 Int. Work. — 2013.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.