Методы приобретения и формализации эмпирических знаний по данным медицинских информационных систем в задачах повышения качества лечения кардиологических пациентов тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Мецкер, Олег Геннадьевич

  • Мецкер, Олег Геннадьевич
  • кандидат науккандидат наук
  • 2018, Санкт-Петербург
  • Специальность ВАК РФ05.13.17
  • Количество страниц 237
Мецкер, Олег Геннадьевич. Методы приобретения и формализации эмпирических знаний по данным медицинских информационных систем в задачах повышения качества лечения кардиологических пациентов: дис. кандидат наук: 05.13.17 - Теоретические основы информатики. Санкт-Петербург. 2018. 237 с.

Введение диссертации (часть автореферата) на тему «Методы приобретения и формализации эмпирических знаний по данным медицинских информационных систем в задачах повышения качества лечения кардиологических пациентов»

Актуальность темы. Информационное моделирование традиционно является способом лучшего понимания оценки происходящих процессов, что дает хорошие возможности предвидеть будущие изменения. Данные медицинских информационных систем, описывающие процессы здравоохранения, содержат эмпирическую информацию о лечении пациентов, на основании которой возможна разработка моделей этих процессов1. Соответствие данных реальному процессу является одним из важных условий моделирования на данных. Электронные медицинские карты (ЭМК), описывающие процесс оказания медицинской помощи, состоят из множества различных видов элементов. Информация в ЭМК содержится как в структурированном виде, так не в структурированном в виде записей на естественном языке (например, протоколы операций, описания диагнозов, анамнезы заболеваний пациента, дневники наблюдения в реанимации, заключения об обследованиях, и другие медицинские записи). С медицинской точки зрения к существенным факторам для принятия клинических решений, содержащихся в ЭМК пациентов с сердечно-сосудистыми заболеваниями (ССЗ), относятся: наличие хронических и сопутствующих заболеваний, наличие осложнений во время операции, результаты лечения, состояния пациента, течение заболеваний, субъективная и объективная оценка пациента, а также другие ценные данные для прогнозирования и принятия решений о лечении пациента. Эти данные представляют значительную ценность для анализа процессов лечения2. В общем, информация ЭМК содержит следующие виды сущностей: клинические события, атрибуты событий, медицинские термины, а также их взаимосвязь. Эти сущности могут существенно расширить возможности информационного моделирования с применением методов интеллектуального анализа данных (ИАД, data mining) и интеллектуального анализа процессов (ИАП, process mining). В отношении применения методов ИАД и ИАП необходимо учитывать требования к структурированию данных. Структурирование информации и факторизация сущностей относится к задачам интеллектуального анализа текстов (ИАТ, text mining). Извлечение информации из текстов на естественном языке сегодня является актуальной научной задаче3. С другой стороны,

1 L. Yang and J. Zhang, "Automatic transfer learning for short text mining," EURASIP J. Wirel.

Commun. Netw., vol. 2017, no. 1, p. 42, 2017.

2 W. M. P. van der A. Ronny S. Mans, Process Mining in Healthcare Evaluating and Exploiting

Operational Healthcare Processes. Springer, 2015.

3 R. Grishman, "Information Extraction," OxfordHandb. Comput. Linguist., 2003.

имеется тенденция к значительному росту объема медицинских записей4. Анализировать медицинские записи без автоматизации становится сложнее. Стремительно развивающаяся область информационного моделирования процессов оказания медицинской помощи делает проблему роста количества и сложности данных серьезной научной проблемой. В медицинских учреждениях России инсталлировано значительное разнообразие медицинских информационных систем (МИС)5. Большинство из них предназначены для внесения и хранения текстовых записей в МИС отдельного медицинского учреждения и ограничены в техническом и аналитическом отношении (отсутствие унифицированных сетей и протоколов, единых форматов хранения и требований к структуре и содержанию ЭМЗ). Помимо этого, специфика медицинских текстов и специфика русского языка существенно осложняют прямое применение существующих методов ИАТ. В результате возникает разрыв между значительным развитием методов ИАТ и методов ИАД и ИАП, что выражается в низкой эффективности применения методов ИАД в медицине. Таким образом, исследования по адаптации методов ИАТ для извлечения знаний медицинской области на основе данных МИС, интеграции и адаптации методов ИАП и ИАД для построения комплексных моделей медицинских процессов представляют научную и практическую ценность. В ходе решения данной научной задачи разработаны методы адаптации технологии ИАТ для извлечения релевантной информации из данных МИС в целях выявления и мониторинга индикаторов качества оказания медицинской помощи. Более того, в ходе данного исследования разработаны предсказательные модели значимых клинических событий (например, летальности) и модели предсказывания вероятности обнаружения значимых патологий при назначении инструментальных исследований. Летальность пациентов является одним из основных индикаторов качества лечения пациентов с ССЗ. Назначение процедуры с учетом персональных особенностей пациента вносит вклад в современные подходы к организации расходов на здравоохранение (ценностно-ориентированное здравоохранения, Р4 медицина). Наличие предсказательных моделей на основе эмпирической информации является качественной характеристикой для системы здравоохранения в задачах управления качеством лечения.

4 R. Anderson, "An Update on the BMA Security Policy," in Personal Medical Information: Security, Engineering, and Ethics, R. Anderson, Ed. Berlin, Heidelberg: Springer Berlin Heidelberg, 1997, pp. 233-250.

5 "Survey: IT in healthcare: key role is given to regions (in Russian)," 2015. [Online]. Available:

http://www.cnews.ru/reviews/publichealth2015.

Степень разработанности темы. Ранние исследования по извлечению информации проходили под эгидой конференции Message Understanding Conference (MUC). Далее область развивалась в отношении автоматического извлечения содержимого (Automatic Content Extraction), семантической оценки (Semantic Evaluation) и изучению естественного языка (Natural Language Learning). На сегодня существует значительное количество систем и инструментов для анализа текста и обработки текста на английском языке, таких как GATE, UIMA, а также специализированных на предметной области систем (TEES, EXCERBT, STRING, GeneMANIA, Genie, GENIA Tagger). Данные системы предоставляют общие возможности, без учета специфики анализируемых текстов, либо не поддерживают специфику русского языка. В отношении методов ИАД и ИАП в области здравоохранения необходимо отметить работы R. S. Mans, W. M. P. van der Aalst, M. W. K. Kirchner, N. Herzberg и др.

Проблема, на решение которой направлено исследование, состоит в разрозненности современных подходов, методов и технологий ИАД и ИАП, локальности их применения, что в сочетании с высокой неопределенностью процессов развития заболеваний и недетерминированностью структуры процесса лечения6, во многом опирающихся на эмпирические знания специалистов (врачей) приводит к неудовлетворительным результатам применения таких методов и технологий. В настоящем исследовании предлагается систематизация доступных методов и технологий в рамках целостных решений, призванных повысить качество применения моделей процессов за счет комплексного подхода к описанию множества аспектов развития заболевания и его лечения. Комплексное представление медицинских процессов ориентировано на достижение принципиально нового уровня в решениях на базе моделирования с использованием интеллектуальных технологий (и, в частности, методов машинного обучения), обеспечивая научную новизну настоящего исследования. При этом важным аспектом является возможность интеграции в информационный, медицинский и организационный процессы в рамках лечебно-профилактического учреждения, что позволяет говорить о практической значимости настоящего исследования.

При соответствующем подходе к извлечению знаний из ЭМК становятся доступны аналитические возможности интеллектуальных методов (ИАТ, ИАД, ИАП). Именно доступность данных образует основу для возможности применения интеллектуальных

6 John Mandrola, "Doctor Doesn't Always Know Best," 2015. [Online]. Available: https://www.medscape.com/viewarticle/849689.

методов, включая повышение уровня качества оказания медицинских услуг и снижения затрат на здравоохранение. Данные методы могут быть использованы для повышения соответствия процессов стандартам, повышению производительности и снижению времени ожидания при снижении затрат. Один из подходов заключается в фокусировании на трудоемких и нетривиальных процессах, которые осуществляются в рамках оказания медицинской помощи. Примерами таких процессов являются подготовка и проведение операции, а также лечение пациентов с острым коронарным синдромом (ОКС). Для улучшения таких сложных и ответственных процессов требуется их глубокий анализ. Традиционный подход к анализу процессов состоит в проведении опросов и собеседований лиц, принимающих решения (ЛПР). Это трудоемкий и дорогостоящий процесс со значительной долей субъективного представления. Персонал, участвующий в процессе оказании медицинской помощи (медсестры, врачи, администрация клиники), как правило, имеют представление об идеальном сценарии без учета того, что в реальности это является лишь одним из множества возможных вариантов. Кроме того, значительное влияние на процессы лечения оказывают организационные вопросы здравоохранения. Различные заинтересованные стороны могут иметь разные мнения, например, некоторые участники процесса могут быть не заинтересованы в снижении общих затрат и повышении прозрачности. Для того чтобы формулировать объективные предложения по улучшению и реорганизации процессов, необходимо разрабатывать методы анализа процессов на доступных объективных журналах событий и таблиц из баз данных МИС. Такой анализ возможен при помощи методов и инструментов интеллектуального анализа, что обуславливает актуальность данной работы.

Цели и задачи исследования. Повышение информативности извлечения и структурирования знаний при помощи методов машинного обучения для разработки моделей комплексных процессов лечения пациентов с сердечно-сосудистыми заболеваниями в задачах повышения качества ценностно-ориентированной медицины. Для достижения поставленной цели решены следующие задачи:

1. Разработка методов извлечения информации из слабоструктурированных данных ЭМК.

2. Разработка информационной (эталонной) модели данных в рамках моделирования процессов оказания медицинской помощи пациентам с сердечно-сосудистыми заболеваниями.

1-5

3. Разработка моделей на основе методов машинного обучения для заблаговременного расчета персонального риска летального исхода на основе динамических данных МИС.

4. Разработка метода исследования и выявления закономерностей, структуры, а также динамики процесса оказания медицинской помощи пациентам с сердечнососудистыми заболеваниями на основе данных МИС, позволяющие выявлять гибкие клинико-статистических группы пациентов.

5. Разработка модели расчета вероятности нахождения значимых патологий при назначении повторных эхокардиографических исследований с учетом персональных характеристик пациентов.

6. Реализация высокопроизводительного программного комплекса, включающего в себя описанные выше модели и методы и проведении вычислительного эксперимента для прогнозирования клинических событий при оказании медицинской помощи пациентам с сердечно-сосудистыми заболеваниями на основе данных МИС.

Объект исследования. Процессы лечения пациентов с сердечно-сосудистыми заболеваниями, представленные информацией и знаниями электронных медицинских записей в базах данных МИС.

Предмет исследования. Модели исследования и выявления закономерностей в процессах оказания высокотехнологичной медицинской помощи пациентам с сердечнососудистыми заболеваниями на основе данных МИС.

Научная новизна исследования определяется комплексным подходом к разработке моделей на основе слабоструктурированных данных, спецификой области здравоохранения, информационного процесса, а также лингвистическими особенностями с ориентацией на разработку предсказательных компонентов систем поддержки принятия решений для:

1. Определения персональных рисков пациента для планирования интенсивности и характера медицинской помощи.

2. Определения традиционных путей лечения пациентов различных нозологических групп для составления персонализированных гибких рекомендаций.

3. Определения исключений и отклонений в процессе лечения.

4. Проверки соблюдения медицинским рекомендациям, стандартам, а также мониторинга индикаторов качества.

5. Назначения медицинских процедур с учетом персональных особенностей и

вероятности обнаружения значимых патологий.

1-6

На основе полученных знаний возможны следующие варианты оптимизации процесса оказания медицинской помощи:

Сокращение издержек путем сокращения излишних медицинских тестов или процедур.

Стандартизация путей диагностики и лечения, типичных для отдельных клинико-статистических групп.

Основные положения, выносимые на защиту:

1. Метод анализ разнородных данных электронных медицинских карт на основе интеллектуальных технологий и технологий высокопроизводительных вычислений с использованием машинного обучения позволяет преобразовывать информацию в знания о закономерностях процесса лечения, а также о персональных группах пациентов для повышения качества предсказательного моделирования в задачах ценностно-ориентированной медицины.

2. Архитектура высокопроизводительного программного комплекса для многомасштабного моделирования на основе интерактивного анализа разнородных ретроспективных медицинских данных, накопленных в рамках специализированного информационного процесса позволяет повышать эффективность принятия клинических решений.

Методы исследования. Интеллектуальный анализ текстов (text mining), интеллектуальный анализ данных (data mining), интеллектуальный анализ процессов (process mining), теория графов, аппарат теории вероятности и математической статистики.

Достоверность положений и результатов, представленных в настоящей диссертации, подтверждается корректной и обоснованной постановкой задач, интерпретацией результатов экспериментов медицинскими экспертами, результатами экспериментальных исследований и внедрением результатов на практике.

Теоретическая значимость работы заключается в развитии интеллектуальных методов извлечения и формализации знаний из данных МИС для моделирования комплексных процессов здравоохранения и решении этих задач повышения качества в рамках концепции персонализированной медицины.

Практическая значимость работы. Область применения полученных результатов включает прогнозирование внутригоспитальной летальности пациентов с сердечнососудистыми заболеваниями, персонализированное назначение процедур высокотехнологичной медицинской помощи, предсказательное моделирование процессов лечения пациентов с сердечно-сосудистыми заболеваниями, выявление и мониторинг

индикаторов качества оказания помощи пациентов с сердечно-сосудистыми заболеваниями.

Внедрение результатов работы. Результаты работы были использованы при выполнении следующих НИОКР: ФЦПИР. Технология выработки персонифицированных рекомендаций для пациентов с хроническими заболеваниями на основе гибридного моделирования жизненных процессов; Интеллектуальные технологии в задачах Р4-медицины, № 617037 от 13.11.2017 г.; Информационная технология обеспечения жизненного цикла систем поддержки принятия решений нового поколения для задач персонифицированной медицины, № 715788 от 15.04.2015. подтверждено актом о внедрении результатов работы в практическую деятельность национального медицинского исследовательского центра имени Алмазова.

Апробация работы. Полученные результаты обсуждались на международных конференциях, семинарах и совещаниях, включая международную конференцию о глобальных вопросах науки, основанной на данных CODATA (Санкт-Петербург, Россия, 2017), XLVII научная и учебно-методическая конференция Университета ИТМО, (Санкт-Петербург, Россия, 2018), 6 Международная Конференция Молодых Ученых в ВПВ и моделирования YSC (Котка, Финляндия,2017), Международная конференция по вычислительным наукам ICCS (Уси, Китай, 2018), 7th International Young Scientists Conference in Computational Science, Heraklion, Greece, 2 - 6 July, 2018, тема доклада «Dynamic mortality prediction using machine learning techniques for acute cardiovascular cases»; International Conference on Health and Social Care Information Systems and Technologies, (Лиссабон, Португалия, 2018), тема доклада «Identification of Pathophysiological Subclinical Variances During Complex Treatment Process of Cardiovascular Patients»; INSCI'2018 - 5th International conference 'Internet Science' (Санкт-Петербург, Россия, 2018), тема доклада «Holistic Monitoring and Analysis of Healthcare Processes through Public Internet Data Collection».

Публикации. По материалам диссертации опубликовано 9 печатных работ, в том числе 9 в научных изданиях, входящих в международные реферативные базы данных и системы цитирования.

Личный вклад соискателя ученой степени заключается в получении результатов, изложенных в диссертации, подтверждается фактом разработки метода извлечения и формализации знаний из слабоструктурированных данных медицинских информационных систем, разработкой моделей на основе извлеченных знаний и информации о процессах здравоохранения, разработкой предсказательной модели выявления значимых патологий

при проведении эхокардиографических исследований, разработкой программного средства для анализа процессов лечения пациентов кардиологического профиля.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы (150 источников). Содержит 135 страниц текста, включая 5 таблиц и 44 рисунка.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Мецкер, Олег Геннадьевич

Заключение

Актуальность разработки настраиваемых средства ИАД с учетом специфики предметной области, данных и процессов ими описанных, не вызывает сомнений. Такая практика интегрирует предметно-ориентированные знания с методами анализа и предоставляет решения для интеллектуального анализа конкретных областей. Тенденции в методах ИАД учтены в данном исследовании (улучшенные масштабируемые, интеграция интеллектуального анализа данных с системами хранения данных и интерактивность баз знаний).

В диссертации задачи анализа данных МИС, извлечении и формализации знаний рассмотрены с точки зрения концепции Р4 медицины, предполагающей системный подход к повышению качества оказания медицинской помощи. Показаны возможности данных МИС отражать реальные процессы лечения и состояния пациентов. Применение методов ИАТ, ИАД, ИАП позволяет выявить закономерности процессов лечения и их связь с патофизиологическими процессами. Именно это позволяет решать широкий класс практических задач классификации, прогнозирования и кластеризации в области здравоохранения с точки зрения взаимодействия пациент-лечение. Разработанная эталонная модель данных обеспечивает процесс решения и постановку задач анализа

медицинских данных. Технологии параллельных вычислений обеспечивают адекватный отклик в процессе анализа данных, извлечения и формализации знаний. Средства визуализации обеспечивают репрезентативные возможностей полученных результатов, а также интерактивность самого процесса анализа. При этом получены следующие результаты:

Разработаны методы извлечения информации из слабоструктурированных данных ЭМК. При разработке методов применялись словари медицинских терминов и синонимов, что существенно сокращает размерность текстовых векторов.

Разработана информационная модель данных, описывающих процессы лечения и патофизиологические процессы течения заболевания пациентов с сердечно-сосудистыми заболеваниями с учетом стадийности течения заболеваний, персональных особенностей пациентов, образа жизни, терапии. Разработанная информационная модель позволяет сократить неопределенность и издержки в процессе анализа данных МИС. Разработана модели на основе методов машинного обучения для заблаговременного расчета рисков клинических событий на основе динамических данных МИС. Разработан метод исследования и выявления закономерностей, структуры, а также динамики процесса оказания медицинской помощи пациентам с сердечно-сосудистыми заболеваниями.

Разработаны методы выявления гибких клинико-статистических групп на основе характеристик пациентов для повешения точности прогнозирования персональных рисков. Реализован программный комплекс, включающий в себя описанные выше методы и модели для проведение вычислительного эксперимента прогнозирования клинических событий при оказании медицинской помощи пациентам с сердечно-сосудистыми заболеваниями. В ходе выполнения научной работы поданы заявки на регистрацию результатов интеллектуальной деятельности: вычислительный программный комплекс моделирования потока пациентов для оценки загрузки отделений медицинского учреждения (SimDepLoad), N 2018662011 от 01.11.2018 г.;

программный комплекс визуального анализа данных медицинских информационных систем (MEDs3D);

программное средство сбора открытых данных и структурирования данных медицинских информационных систем для задач анализа и моделирования процессов в здравоохранении (МеёО^ег), N 2018662009, от 01.11.2018 г..

Применимость результатов исследования подтверждено актом внедрении результатов диссертационной работы в практическую деятельность ФГБУ «Национальный

медицинский исследовательский центр имени В.А. Алмазова» Минздрава России (приложение 1).

Таким образом, задачи диссертационного исследования решены в полном объеме, поставленная цель достигнута. Разработанные методы, алгоритмы и программные средства разработаны с учетом специфики предметной области здравоохранения в соответствии с особенностями информационного процесса и технических возможностей технологий параллельных вычисления и распределенного хранения данных, что обеспечивает оперативность и масштабируемость предложенных решений в процессе анализа медицинских данных.

Список литературы диссертационного исследования кандидат наук Мецкер, Олег Геннадьевич, 2018 год

Библиографический список

[1] L. Yang and J. Zhang, "Automatic transfer learning for short text mining," EURASIP J. Wirel. Commun. New., vol. 2017, no. 1, p. 42, 2017.

[2] W. M. P. van der A. Ronny S. Mans, Process Mining in Healthcare Evaluating and Exploiting Operational Healthcare Processes. Springer, 2015.

[3] R. Grishman, "Information Extraction," OxfordHandb. Comput. Linguist., 2003.

[4] R. Anderson, "An Update on the BMA Security Policy," in Personal Medical Information: Security, Engineering, and Ethics, R. Anderson, Ed. Berlin, Heidelberg: Springer Berlin Heidelberg, 1997, pp. 233-250.

[5] "Survey: IT in healthcare: key role is given to regions (in Russian)," 2015. [Online]. Available: http://www.cnews.ru/reviews/publichealth2015.

[6] John Mandrola, "Doctor Doesn't Always Know Best," 2015. .

[7] R. Feldman and J. Sanger, Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. New York, NY, USA: Cambridge University Press, 2006.

[8] R. N. Kostoff, "Text Mining for Global Technology Watch," Encyclopedia of Library and Information Science, Second Edition. Inc. New York, pp. 2789-2799, 2003.

[9] D. D. Lewis, "Evaluating Text Categorization," in Proceedings of the Workshop on Speech and Natural Language, 1991, pp. 312-318.

[10] C. Burstein, F., & Holsapple, Handbook on decision support systems 1. New York: SpringerVerlag, 2008.

[11] V. Rakocevic, G., Djukic, T., Filipovic, N., Milutinovic, Computational medicine in data mining and modeling. New York : Springer, 2013.

[12] B. Miner, G., Delen, D., Elder, J., Fast, A., Hill, T., & Nisbet, Practical text mining and

statistical analysis for non-structured text data applications. Amsterdam: The Netherlands: Academic Press, 2012.

[13] C. J. C. Cerrito P., "Data and text mining the electronic medical record to improve care and to lower costs," Proc. SUGI, vol. 31, pp. 26-29, 2006.

[14] M. Chiarini, T. Donald, S. L. Luther, P. R. Foulis, and D. D. French, "Identifying fall-related injuries : Text mining the electronic medical record," pp. 253-265, 2009.

[15] E. H. Hansen, B. Bruun, L. Firm, P. Warrer, E. H. Hansen, and L. Juhl-jensen, "Using text-mining techniques in electronic patient records to identify ADRs from medicine use Using text-mining techniques in electronic patient records to identify ADRs from medicine use," no. September 2017, 2011.

[16] Z. V. Mitrofanova O., "Automatic analysis of terminology in the Russian corpus on corpus linguistics," /Computer Linguist. Intellect. Technol. Proc. Annu. Int. Conf. "Dialogue," pp. 321-328, 2009.

[17] G. Karystianis, A. Dehghan, A. Kovacevic, J. A. Keane, and G. Nenadic, "Using local lexicalized rules to identify heart disease risk factors in clinical notes," vol. 58, 2015.

[18] E. F. Gomes, A. M. Jorge, L. Tec, P. J. Azevedo, and H. Tec, "Classifying Heart Sounds using SAX Motifs , Random Forests and Text Mining techniques," pp. 334-337, 2014.

[19] H. Yang and J. M. Garibaldi, "A hybrid model for automatic identification of risk factors for heart disease," vol. 58, 2015.

[20] C. H. W. Frada B., Handbook on Decision Support Systems. 2008.

[21] S. Roweis, L. S.- science, and undefined 2000, "Nonlinear dimensionality reduction by locally linear embedding," science.sciencemag.org.

[22] B. S. Everitt and G. Dunn, "Principal Components Analysis," in Applied Multivariate Data Analysis, West Sussex, United Kingdom: John Wiley & Sons, Ltd,., 2013, pp. 4873.

[23] M. E. Tipping and C. M. Bishop, "Probabilistic Principal Component Analysis," J. R. Stat. Soc. Ser. B (StatisticalMethodol., vol. 61, no. 3, pp. 611-622, Aug. 1999.

[24] X. Wu etal., "Top 10 algorithms in data mining," Knowl. Inf. Syst., vol. 14, no. 1, pp. 137, Jan. 2008.

[25] J. Han, J. Pei, Y. Yin, and R. Mao, "Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach," DataMin. Knowl. Discov., vol. 8, no. 1, pp. 53-87, Jan. 2004.

[26] Hartigan J, Clustering algorithms. 1975.

[27] J. Hartigan, M. W.-J. of the R. S. S. S. C, and undefined 1979, "Algorithm AS 136: A k-

means clustering algorithm," JSTOR.

[28] S. Safavian, D. L.-I. transactions on systems, undefined man, and undefined 1991, "A survey of decision tree classifier methodology," ieeexplore.ieee.org.

[29] Golden R. M., Mathematical methods for neural network analysis and design. MIT Press, 1996.

[30] M. A. Grando, M. H. Schonenberg, and W. Van Der Aalst, "Semantic Process Mining for the Verification of Medical Recommendations."

[31] P. J. M. B. R.S. Mans, H. Schonenberg, M. Song, W.M.P. van der Aalst, "Application of process mining in healthcare - a case study in a dutch hospital," A.L.N. Fred, J. Filipe, H. Gamboa (Eds.), Biomed. Eng. Syst. Technol. Int. Jt. Conf. BIOSTEC 2008, Funchal, Madeira, Port. January 28-31, vol. 25, no. Communications in Computer and Information Science, Springer, pp. 425-438, 2008.

[32] W. van der Aalst, Process mining: data science in action. .

[33] R. S. Mans, N. C. Russell, W. M. P. van der Aalst, P. J. M. Bakker, A. J. Moleman, and M. W. M. Jaspers, "Proclets in healthcare," J. Biomed. Inform., vol. 43, no. 4, pp. 632649, 2010.

[34] R. S. Mans, W. M. P. van der Aalst, R. J. B. Vanwersch, and A. J. Moleman, "Process Mining in Healthcare: Data Challenges When Answering Frequently Posed Questions," 2013, pp. 140-153.

[35] E. V. Bologva, D. I. Prokusheva, A. V. Krikunov, N. E. Zvartau, and S. V. Kovalchuk, "Human-Computer Interaction in Electronic Medical Records: From the Perspectives of Physicians and Data Scientists," Procedia Comput. Sci., vol. 100, pp. 915-920, 2016.

[36] A. K. A. de Medeiros et al., "Process Mining Based on Clustering: A Quest for Precision," Springer, Berlin, Heidelberg, 2008, pp. 17-29.

[37] W. M. P. van der Aalst, Process Mining. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011.

[38] M. Netjes, S. Limam Mansar, H. A. Reijers, and W. M. P. Van Der Aalst, "An Evolutionary Approach for Business Process Redesign."

[39] M. T. Wynn, M. Dumas, C. J. Fidge, A. H. M. ter Hofstede, and W. M. P. van der Aalst, "Business Process Simulation for Operational Decision Support," Springer, Berlin, Heidelberg, 2008, pp. 66-77.

[40] N. Mulyar, M. Pesic, W. M. P. van der Aalst, and M. Peleg, "Declarative and Procedural Approaches for Modelling Clinical Guidelines: Addressing Flexibility Issues," Springer, Berlin, Heidelberg, 2008, pp. 335-346.

[41] R. S. Mans, W. van der Aalst, and R. J. B. Vanwersch, Process Mining in Healthcare: Evaluating and Exploiting Operational Healthcare Processes. Springer Publishing Company, Incorporated, 2015.

[42] G. Leonardi, S. Panzarasa, S. Quaglini, M. Stefanelli, and W. M. P. van der Aalst, "Interacting agents through a web-based health serviceflow management system," J. Biomed. Inform., vol. 40, no. 5, pp. 486-499, 2007.

[43] W. M. P. van der Aalst, Process Mining. Discovery, Conformance and Enhancement of Business Processes. New York and London: Springer, 1998.

[44] M. S. and W. M. P. van der Aalst., "Towards Comprehensive Support for Organizational Mining," Decis. Support Syst., vol. 46(1), pp. 300-317, 2008.

[45] and M. S. W.M.P. van der Aalst, H.A. Reijers, "Discovering Social Networks from Event Logs," Comput. Support. Coop. Work, vol. 14, pp. 549-593, 2005.

[46] S. W. and K. Faust., "Social Network Analysis: Methods and Applications," Cambridge Univ. Press, 1994.

[47] W. M. P. van der Aalst, "Business Process Simulation Revisited," Springer, Berlin, no. Enterprise and Organizational Modeling and Simulation, volume 63 of Lecture Notes in Business Information Processing, pp. 1 -14, 2010.

[48] R. J. V. R. Mans, W. van der Aalst, Process Mining in Healthcare: Evaluating and Exploiting Operational Healthcare Processes. Springer, 2015.

[49] J. Zhou, "Master: Process Mining: Acquiring Objective Process Information for Healthcare Process Management with the Crisp-dm Framework (Ph.D. thesis, Master's thesis)," Eindhoven Univ. Technol. Eindhoven, 2009.

[50] H. P. M. Lang, T. Bürkle, S. Laumann, "Process mining for clinical workflows: challenges and current limitations," Proc. MIE2008, XXIst Int. Congr. Eur. Fed. Med. Informatics, Göteborg,IOSPress, vol. 136, no. Studies in Health Technology and Informatics, p. Press, 2008, 2008.

[51] D. of E. Kim, S. Kim, M. Song, S. Kim, D. Yoo, H. Hwang, S. Yoo and outpatient care process of a Tert, "Discovery of outpatient care process of a tertiary university hospital using process mining," Healthc. Inf., vol. 19 (1), pp. 42-49, 2013.

[52] F. W. G.T. Lakshmanan, S. Rozsnyai, "Investigating clinical care pathways correlated with outcomes," Bus. Process Manag. Springer, pp. 323-338, 2013.

[53] S. Y. M. Cho, M. Song, "A systematic methodology for outpatient process analysis based on process mining," Asia Pacific Bus. Process Manag. Springe, pp. 31-42, 2014.

[54] B. F. Caron, J. Vanthienen, K. Vanhaecht, E. van Limbergen, J.D. Weerdt and Baesens,

"Monitoring care processes in the gynecologic oncology department," Comput. Biol. Med., vol. 44, pp. 88-96, 2014.

[55] B. B. F. Caron, J. Vanthienen, J. De Weerdt, "Beyond X-raying a care-flow: adopting different focuses on care-flow mining," Proc. First Int. Bus. Process Intell. Chall., pp. 111, 2011.

[56] et al. H. Fei, N. Meskens, "Discovering patient care process models from event logs," 8th Int. Conf. Model. Simulation, MOSIM2008, vol. 10, pp. 10-12, 2008.

[57] J. K. S. Suriadi, R.S. Mans, M.T. Wynn, A. Partington, "Measuring patient flow variations: a cross-organisational process mining approach," Asia Pacific Bus. Process Manag. Springer, pp. 43-58, 2014.

[58] G. M. S. Montani, G. Leonardi, S. Quaglini, A. Cavallini, "Mining and retrieving medical processes to assess the quality of care," Case-Based Reason. Res. Dev. Springer, pp. 233240, 2013.

[59] R. A. Dagliati, L. Sacchi, C. Cerra, P. Leporati, P. De Cata, L. Chiovato, J. Holmes and et al. Bellazzi, "Temporal data mining and process mining techniques to identify cardiovascular risk-associated clinical pathways in type 2 diabetes patients," 2014IEEE-EMBSInt. Conf. Biomed. Heal. Informatics, pp. 240-243, 2014.

[60] V. T. C. Fernandez-Llatas, A. Lizondo, E. Monton, J.-M. Benedi, "Process mining methodology for health process tracking using real-time indoor location systems," Sensors 15, pp. 29821-29840.

[61] W. M. P. van der A. R.P.J.C. Bose, "Analysis of patient treatment procedures," Bus. Process Manag. Work. - BPM 2011 Int. Work. Clermont-Ferrand, Fr. August 29, Revis. Sel. Pap. Part I, Lect. Notes Bus. Inf. Process. Springer, vol. 99, pp. 165-166, 2011.

[62] M. W. K. Kirchner, N. Herzberg, A. Rogge-Solti, "Embedding conformance checking in a process intelligence system in hospital environments," Process Support Knowl. Represent. Heal. Care -+ BPM 2012 Jt. Work. ProHealth 2012/KR4HC 2012, Tallinn, Est. Sept. 3, vol. 7738, pp. 126-139, 2012.

[63] Z. Huang, W. Dong, L. Ji, C. Gan, X. Lu, and H. Duan, "Discovery of clinical pathway patterns from event logs using probabilistic topic models," J. Biomed. Inform., vol. 47, pp. 39-57, 2014.

[64] L. L. Z. Zhou, Y. Wang, "Process mining based modeling and analysis of workflows in clinical care—a case study in a chicago outpatient clinic," IEEE 11th Int. Conf. Networking, Sens. Control (ICNSC), IEEE, p. 590-595., 2014.

[65] A. Senderovich, S. J. J. Leemans, S. Harel, A. Gal, A. Mandelbaum, and W. M. P. van der

Aalst, "Discovering queues from event logs with varying levels of information," Lect. Notes Bus. Inf. Process., vol. 256, pp. 154-166, 2016.

[66] K. van U. C. Günther, A. Rozinat, W. van der Aalst, "Monitoring Deployed Application Usage with Process Mining," BPMCent. Rep. BPM-08-11, pp. 1-8, 2008.

[67] G. B. D. Antonelli, "Application of process mining and semantic structuring towards a lean healthcare network," RisksResil. Collab. Networks, Springer, pp. 497-508, 2015.

[68] J. L. S. D. Forsberg, B. Rosipko, "Analyzing pacs usage patterns by means of process mining: steps toward a more detailed workflow analysis in radiology," J. Digit. Imaging, vol. 29, pp. 47-58, 2016.

[69] R. M. M.A. Grando, W.M.P. van der Aalst, "Reusing a declarative specification to check the conformance of different cigs," Bus. Process Manag. Work. - BPM 2011 Int. Work. Clermont-Ferrand, Fr. August 29, 2011, Revis. Sel. Pap. Part II, Lect. Notes Bus. Inf. Process. Springer, vol. 100, pp. 188-199, 2011.

[70] W. M. P. van der A. M. Grando, M. Schonenberg, "Semantic-based conformance checking of computer interpretable medical guidelines," Biomed. Eng. Syst. Technol. Springer, pp. 285- 300, 2013.

[71] M. S. R.D. Dewandono, R. Fauzan, R. Sarno, "Ontology and process mining for diabetic medical treatment sequencing," Proc. 7th Int. Conf. Inf. Commun. Technol. Syst., pp. 171178, 2013.

[72] D. R. F. A. Rebuge, "Business process analysis in healthcare environments: a methodology based on process mining," Inform. Syst., vol. 37 (2), pp. 99-116, 2012.

[73] E. M. L. J. Poelmans, G. Dedene, G. Verheyden, H.V. der Mussele, S. Viaene and Peters, "Combining business process and data discovery techniques for analyzing and improving integrated care pathways," P. Perner (Ed.), Adv. Data Mining. Appl. Theor. Asp. 10th Ind. Conf. ICDM 2010, Berlin, Ger. July 12-14, 2010. Proceedings, Lect. Notes Comput. Sci. Springer, vol. 6171, pp. 505-517, 2010.

[74] N. N. T. Blum, N. Padoy, H. Feußner, "Workflow mining for visualization and analysis of surgeries," Int. J. Comput. Assist. Radiol. Surg., vol. 3 (5), pp. 379-386, 2008.

[75] S. Van De, "Process Mining in Healthcare Mining for Cost and (Near) Incidents," (Ph.D. thesis), Eindhoven Univ. Technol. Eindhoven, 2015.

[76] S. Gupta, "Workflow and Process Mining in Healthcare," (Ph.D. thesis, Master's thesis), Tech. Univ. Eindhoven, 2007.

[77] J. G. M. Peleg, P. Soffer, "Mining process execution and outcomes - position paper," Bus. Process Manag. Work. BPM 2007 Int. Work. BPI, BPD, CBP, ProHealth, RefMod,

Semant. Brisbane, Aust. Sept. 24, 2007, Revis. Sel. Pap. Lect. Notes Comput. Sci. Springer, vol. 4928, pp. 395-400, 2007.

[78] O. T. Neumuth, P. Jannin, J. Schlomberg, J. Meixensberger, P. Wiedemann and Burgert, "Analysis of surgical intervention populations using generic surgical process models," Int. J. Comput. Assist. Radiol. Surg., vol. 6 (1), pp. 59-71, 2011.

[79] K. J. and L. M. Kristensen, "Coloured Petri Nets," Springer, Berlin, 2009.

[80] R. Lenz, M. R.-D. & K. Engineering, and undefined 2007, "IT support for healthcare processes-premises, challenges, perspectives," Elsevier.

[81] K. Anyanwu, A. Sheth, ... J. C.-J. of research, and undefined 2003, "Healthcare enterprise process development and integration," search.informit.com.au.

[82] M. Poulymenopoulou, ... F. M.-J. of medical, and undefined 2003, "Specifying workflow process requirements for an emergency medical service," Springer.

[83] R. Mans, H. Schonenberg, ... G. L.-S. in health, and undefined 2008, "Process mining techniques: an application to stroke care," researchgate.net.

[84] "'World Health Organization'. A Glossary of Terms for Community Health Care and Services for Older Persons," WHO Cent. Heal. Dev. Ageing Heal. Tech. Rep. 5, 2004.

[85] L. Shi, "The Impact of Primary Care: A Focused Review," Scientifica (Cairo)., vol. 22, 2012.

[86] B. Starfield, "Is Primary Care Essential?," Lancet, vol. 344, pp. 1129-1133, 1994.

[87] and J. S. S. S.M. Schneider, G.C. Hamilton, P. Moyer, "Definition of Emergency Medicine," Acad. Emerg. Med., vol. 5(4), pp. 348-351, 1998.

[88] "Приказ Министерства здравоохранения и социального развития РФ от 15 мая 2012 г. N 543н 'Об утверждении Положения об организации оказания первичной медико-санитарной помощи взрослому населению.'" [Online]. Available: http://base.garant.ru/70195856/.

[89] D. G. and B. Denton, "Appointment Scheduling in Health Care: Challenges and Opportunities," IIE Trans., vol. 40(9), pp. 800-819, 2008.

[90] H. R. S. O'connor T. M., "Extending rural and remote medicine with a new type of health worker: physician assistants," Aust. J. Rural Health, vol. №. 6, pp. 346-351, 2007.

[91] Soko Setoguchi, "Repeated hospitalizations predict mortality in the community population with heart failure," Am. Heart J., vol. 154, no. 260-266, 2007.

[92] K. Thygesen et al., "Third universal definition of myocardial infarction," Circulation, vol. 126, no. 16, pp. 2020-2035, 2012.

[93] A. D. Weston and L. Hood, "Systems Biology, Proteomics, and the Future of Health Care: Toward Predictive, Preventative, and Personalized Medicine," J. Proteome Res., vol. 3, no. 2, pp. 179-196, Apr. 2004.

[94] Z. A. H., Physical biology: from atoms to medicine. Imperial college press, 2008.

[95] G. Ginsburg and H. Willard, Essentials of genomic and personalized medicine. Academic Press, 2009.

[96] C. Auffray, D. Charron, and L. Hood, "Predictive, preventive, personalized and participatory medicine: back to the future," 2010.

[97] K. N. Lohr and S. A. Schroeder, "A Strategy for Quality Assurance in Medicare," N. Engl. J. Med., vol. 322, no. 10, pp. 707-712, Mar. 1990.

[98] J. P. Jiawei Han, Micheline Kamber, Data mining: concepts and techniques. 2012.

[99] A. V Krikunov, E. V Bolgova, E. Krotov, T. M. Abuhay, A. N. Yakovlev, and S. V Kovalchuk, "Complex data-driven predictive modeling in personalized clinical decision support for Acute Coronary Syndrome episodes," Procedia - Procedia Comput. Sci., vol. 80, pp. 518-529, 2016.

[100] A. Semakova, N. Zvartau, E. Bolgova, and A. Konradi, "Quality of Hypertensive Patients ' Electronic Health Records in Specialized Cardiological Centre : 6-Year Trends Quality of Hypertensive Patients ' Electronic Health Records in Specialized Cardiological Centre : 6-Year," no. July 2017, 2016.

[101] H. Cunningham, V. Tablan, A. Roberts, and K. Bontcheva, "Getting More Out of Biomedical Documents with GATE's Full Lifecycle Open Source Text Analytics," PLOS Comput. Biol., vol. 9, no. 2, pp. 1-16, 2013.

[102] Y. Heights, "UIMA : an architectural approach to unstructured information processing in the corporate research environment," vol. 10, no. Roush 2003, pp. 327-348, 2017.

[103] Z. Lu, Y. Zhu, S. J. Pan, E. W. Xiang, Y. Wang, and Q. Yang, "Source Free Transfer Learning for Text Classification," pp. 122-128.

[104] G. Rakocevic, T. Djukic, N. Filipovic, and V. Milutinovic, Computational medicine in data mining and modeling, vol. 9781461487. 2013.

[105] P. Thompson et al., "Text Mining the History of Medicine," PLoS One, vol. 11, no. 1, p. e0144717, Jan. 2016.

[106] L. Pereira, R. Rijo, C. Silva, and R. Martinho, "Text Mining Applied to Electronic Medical Records," Int. J. E-HealthMed. Commun., vol. 6, no. 3, pp. 1-18, Jul. 2015.

[107] Bino Patric Prakash G, S. G. Jacob, and Radhameena S, "Mining semantic representation from medical text: A Bayesian approach," in 2014 International Conference on Recent

Trends in Information Technology, 2014, pp. 1-4.

[108] J. Urbain, "Mining heart disease risk factors in clinical text with named entity recognition and distributional semantic models," J. Biomed. Inform., vol. 58, pp. S143-S149, Dec. 2015.

[109] A. Casillas, K. Gojenola, A. Perez, and M. Oronoz, "Clinical text mining for efficient extraction of drug-allergy reactions," Proc. - 2016 IEEE Int. Conf. Bioinforma. Biomed. BIBM2016, pp. 946-952, 2017.

[110] World Health Organization, Health in 2015: from MDGs, Millennium Development Goals to SDGs, Sustainable Development Goals, 2015. .

[111] F. Miao, Y. Cai, Y. Zhang, X. Fan, and Y. Li, "Predictive Modeling of Hospital Mortality for Patients With Heart Failure by Using an Improved Random Survival Forest," IEEE Access, vol. 6, pp. 7244-7253, 2018.

[112] A. Yakovlev, O. Metsker, S. Kovalchuk, and E. Bologova, "Mortality and length of stay in acute coronary syndrome patients using machine-learning methods," J. Am. Coll. Cardiol., vol. 71, no. 11, p. A242, Mar. 2018.

[113] E. Soria-Olivas, J. D. Martin-Guerrero, J. Redon, M. Tellez-Plaza, and J. Vila-Frances, "Improving Mortality Prediction in Cardiovascular Risk Patients by Balancing Classes," in 2015 IEEE International Conference on Data Mining Workshop (ICDMW), 2015, pp. 480-484.

[114] O. Pauly, "Random Forests for Medical Applications," 2012.

[115] M. H. A. Yazid, S. Talib, M. H. Satria, and A. A. Ghazi, "Neural network on mortality prediction for the patient admitted with ADHF (acute decompensated heart failure)," in 2017 4th International Conference on Electrical Engineering, Computer Science and Informatics (EECSI), 2017, no. September, pp. 1-6.

[116] D. B. McLaughlin and J. M. Hays, Healthcare Operations Management. Health Administration Press, 2008.

[117] C.-T. Chen, Linear System Theory and Design, 3rd ed. New York, NY, USA: Oxford University Press, Inc., 1998.

[118] W. M. P. van der A. R. S. Mans, Process Mining in Healthcare: Data Challenges When Answering Frequently Posed Questions. Berlin: Springer, 2013.

[119] I. T. . Reijers, H.A., & Vanderfeesten, "Cohesion and coupling metrics for workflow process design. In J. Desel, B. Pernici, & M. Weske (Eds.), BPM 2004 (LNCS 3080) (Vol. LNCS 3080, pp. 290- 305). Berlin: Springer-Verlag, 2004."

[120] J. J. S. W.E. Evans and W. J. J. and H. Harrison, "Applied Pharmacokinetics. Principles of

Therapeutic Drug Monitoring," Appl. Ther. Inc, 1986.

[121] P. J. Pentikäinen, P. J. Neuvonen, and A. Penttilä, "Pharmacokinetics of metformin after intravenous and oral administration to man," Eur. J. Clin. Pharmacol., vol. 16, no. 3, pp. 195-202, 1979.

[122] W. M. P. van der A. R. S. Mans, N. C. Russell, "Proclets in healthcare," J. Biomed. Inf., vol. 43, pp. 632-649, 2010.

[123] K. B. Lassen and W. M. P. van der Aalst, "Complexity Metrics for Workflow Nets," Inf. Softw. Technol., vol. 51, no. 3, pp. 610-626, 2009.

[124] P. W. M. La Rosa, A H M. ter Hofstede, "Managing Process Model Complexity via Concrete Syntax Modifications," IEEE Trans. Ind. Informatics, vol. 7(2), pp. 255-265, 2011.

[125] F. E. Asma Mejri, Sonia Ayachighannouchi, Ricardo Martinho, "Enhancing Bisiness Process Flexibility in an Emergency Care Process," Lab. Riad. ENSI, 2010.

[126] and K. P. C. Zikopoulos, D. deRoos, "Harness the Power of Big Data, McGraw-Hill," 2012.

[127] M. W. Mahoney, "Tensor-CUR Decompositions for Tensor-Based Data Tensor-CUR Decompositions For Tensor-Based Data," no. September, 2014.

[128] T. G. K. and B. W. Bader, "Tensor decompositions and applications," SIAMRev., vol. 51, pp. 455-500, 2009.

[129] I. Transactions and D. Engineering, "Unsupervised Multiway Data Analysis : A Literature Survey," no. February, 2009.

[130] A. H. Andersen and W. S. Rayens, "Structure-seeking multilinear methods for the analysis of flMRI data," vol. 22, pp. 728-739, 2004.

[131] P. A. Valde, F. Miwakeichi, E. Marti, N. Nishiyama, H. Mizuhara, and Y. Yamaguchi, "Decomposing EEG data into space - time - frequency components using Parallel Factor Analysis," vol. 22, pp. 1035-1045, 2004.

[132] M. Jackson, "Social and Economic Networks," Princet. Univ., 2008.

[133] D. Edwards, "Introduction to Graphical Modelling," Springer, 2000.

[134] C. Chamley, Rational Herds: Economic Models of Social Learning. Cambridge Univ. Press, 2004.

[135] M. Newman, "Networks: An Introduction," Oxford Univ. Press, 2010.

[136] Kindermann and J. L. Snell, "Markov Random Fields and Their Applications," Am. Math. Soc., vol. 12, 1980.

[137] A. S. Willsky, "Multiresolution Markov Models for Signal and Image Processing," vol. 90, no. 8, 2002.

[138] J. Besag, "Spatial interaction and the statistical analysis of lattice systems." J. Royal Stat. Soc., pp. 192-236, 1974, 1974.

[139] J. M. H. and D. C. Handscomb, "Monte Carlo Methods," Chapman Hall, 1964.

[140] Z. Lu, Y. Wen, and G. Cao, "Community Detection in Weighted Networks : Algorithms and Applications."

[141] F. Radicchi, C. Castellano, F. Cecconi, V. Loreto, and D. Parisi, "Defining and identifying communities in networks," 2004.

[142] A. Clauset, M. E. J. Newman, and C. Moore, "Finding community structure in very large networks," pp. 1-6, 2004.

[143] F. Wu and B. A. Huberman, "P HYSICAL J OURNAL B Finding communities in linear time : a physics approach," vol. 338, pp. 331-338, 2004.

[144] M. E. J. Newman, "Finding community structure in networks using the eigenvectors of matrices," 2006.

[145] M. E. J. Newman, "Modularity and community structure in networks," vol. 103, no. 23, pp. 8577-8582, 2006.

[146] J. S. Lawton, "Sex and Gender Differences in Coronary Artery Disease PRESENTATION AND DIAGNOSIS," YSTCS, vol. 23, no. 2, pp. 126-130, 2011.

[147] C. Tan, W. Zhang, J. Zhou, Z. Wang, and S. Wang, "Correlation Between Platelet and Hemoglobin Levels and Pathological Characteristics and Prognosis of Early-Stage Squamous Cervical Carcinoma," pp. 3921-3928, 2015.

[148] W. M. P. van der Aalst, Process Mining: Data Science in Action, 2nd ed. Heidelberg: Springer, 2016.

[149] E. Rolon, J. Cardoso, F. Garcia, F. Ruiz, and M. Piattini, "Analysis and Validation of Control-Flow Complexity Measures with BPMN Process Models," no. 4, 2009.

[150] P. Kokol, M. Mernik, J. Zavrsnik, K. Kancler, and I. Malcic, "Decision trees based on automatic learning and their use in cardiology," J. Med. Syst., vol. 18, no. 4, pp. 201-206, Aug. 1994.