Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе

Чебанов Дмитрий Константинович

Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Чебанов Дмитрий Константинович

Чебанов Дмитрий Константинович
кандидат наук
2021

Специальность ВАК РФ05.13.17

Количество страниц 121

Чебанов Дмитрий Константинович. Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе: дис. кандидат наук: 05.13.17 - Теоретические основы информатики. ФГУ «Федеральный исследовательский центр «Информатика и управление» Российской академии наук». 2021. 121 с.

Оглавление диссертации кандидат наук Чебанов Дмитрий Константинович

ВВЕДЕНИЕ

1. ОБЗОР МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ОНКОЛОГИЧЕСКИХ ДАННЫХ И ПОСТАНОВКА ЗАДАЧИ

1.1. Обзор методов искусственного интеллекта, применяемых для анализа онкологических данных

1.1.1. Обзор актуальных задач в сфере исследования и лечения онкозаболеваний17

1.1.2. Используемые типы представления знаний

1.1.3. Логико-математический и программный инструментарий

1.2. Постановка задачи диссертационной работы

1.3. Обоснование выбора метода интеллектуального анализа данных

2. ОПИСАНИЕ ДСМ-метода АПИ

2.1. Общее описание ДСМ-метода АПИ

2.2. Реализация ДСМ-рассуждений

2.3. Постановка проблем реализации

3. АЛГОРИТМИЧЕСКАЯ РЕАЛИЗАЦИЯ ДСМ-метода АПИ

3.1. Выбор способа программной реализации

3.2. Параллельное выполнение процедур

3.3. Оптимизация работы с памятью

3.4. Результаты оптимизации

4. ОПИСАНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ

4.1. Компоненты интеллектуальной системы

4.2. Графический интерфейс интеллектуальной системы

5. ЭКСПЕРИМЕНТЫ ПО ИНТЕЛЛЕКТУАЛЬНОМУ АНАЛИЗУ ОНКОЛОГИЧЕСКИХ ДАННЫХ

5.1. Описание базы фактов

5.2. Представление знаний

5.2.1. Представление клинических данных

5.2.2. Представление генетических данных

5.2.3. Представление иммунных данных

5.3. Постановка задачи проведения эксперимента

2

5.4. Объединение стратегий

5.5. Результаты экспериментов

5.6. Перспектива развития интеллектуальной системы

5.6.1. Практическая значимость интеллектуальной системы

5.6.2. Универсализация интеллектуальной системы

ЗАКЛЮЧЕНИЕ

Список литературы

Список иллюстраций

Приложение А. Интеллектуальная система для анализа онкологических данных. Руководство пользователя

Приложение Б. Результаты эксперимента

Приложение В. Перечень предикатов

Введение диссертации (часть автореферата) на тему «Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе»

ВВЕДЕНИЕ

Одним из основных направлений искусственного интеллекта (ИИ) как области исследований и разработок является интеллектуальный анализ данных (ИАД), который реализуется с помощью интеллектуальной системы (ИС), и представляет собой процесс поиска закономерностей в исходных данных. Наиболее оправданно применение ИАД в тех областях знаний, где отсутствует строгая формализация данных, а также нет однозначного общепринятого алгоритма их обработки. К таким областям относятся медицина, биология, химия, социология, и другие научные дисциплины.

Проблематика формирования (конструктивного порождения) нового знания из уже имеющихся знаний и постоянно накапливаемых эмпирических данных (knowledge discovery) - одно из актуальных и практически значимых направлений исследований и разработок в области искусственного интеллекта.

Пример актуальной задачи такого типа:

i) Анализируемая проблема:

- исследуется «механизм» возникновения определенного явления\эффекта;

- влияние на эффект оказывает выделенное большое множество факторов;

- в той или иной конкретной ситуации каждый из таких факторов в отдельности может быть либо активен («влияет»), либо не активен («не влияет»);

- все возможные комбинации активных и неактивных факторов распадаются

на два класса - «безвредные» (когда изучаемый целевой эффект не наблюдается) и «вредоносные» (когда наличествует целевой эффект).

ii) Исходные данные:

- заданное множество «примеров» (некоторых «вредоносных» комбинаций

факторов влияния) и

- заданное множество «контр-примеров» (некоторых «безвредных» комбинаций факторов влияния).

±11) Найти:

- все такие подмножества факторов влияния, которые содержат все те и только те факторы («замкнутые» - несокращаемые и непополняемые -подмножества факторов), которые определяют «вредоносность» имеющихся примеров и безвредность имеющихся контрпримеров.

Пример актуальной прикладной задачи такого типа:

• выявление механизмов возникновения меланомы (рака кожи человека), определяемых мутациями отдельных генов (из множества в несколько сотен релевантных этой проблеме генов), в ситуации, когда некоторые подмножества индивидуальных мутаций - вредоносны (ведут к возникновению меланомы), а некоторые - нет

Современная онкология является одной из наиболее наукоемких отраслей медицины. Онкологическое заболевание характеризуется сбоем в регуляции процессов жизнедеятельности клеток, и возникает в результате комбинации различных факторов: как внутренних, проявляющихся в организме, так и внешних. Однако процесс развития опухоли всегда происходит в результате различных нарушений в работе ДНК, которые могут являться как первопричиной заболевания, так и следствием внешних воздействий окружающей среды. Далеко не все биологические механизмы опухоли и функции генов, составляющих ДНК, в настоящий момент известны науке, соответственно, речь идет о плохо формализованной области знаний. В данном случае применение методов ИАД является оправданным.

Исследователями наработано значительное количество данных, которые не под силу обрабатывать эксперту без применения специализированных программных инструментов. Наиболее актуальными задачами в онкологии являются прогнозирование развития заболевания и обнаружение

молекулярно-генетических механизмов, вносящих весомый вклад в заболевание.

ИАД реализуется посредством инструментов, основанных на машинном обучении, которое отличается от широко распространенных в медицине статистических методов анализа данных возможностью исследования нелинейных зависимостей для множества переменных, которые не являются независимыми друг от друга, что часто имеет место в биологических системах.

Одним из инструментов ИАД, который был успешно применен к задачам предсказания возникновения и прогнозирования течения онкологического заболевания [1,2], является ДСМ-метод автоматизированной поддержки исследований (ДСМ-метод АПИ) [3,4,5,6,7], который реализует обнаружение закономерностей в сложноструктурированных эмпирических данных, содержащих причинно-следственные зависимости в неявном виде. Он обеспечивает формализацию знаний предметной области средствами многозначной логики, для чего обобщает в гипотезах информацию, полученную из обучающей выборки, затем применяет эти гипотезы для предсказания исследуемого эффекта у неизученных объектов, а также имеет критерий достаточного основания для принятия результатов правдоподобного вывода. ИС на основе ДСМ-метода АПИ реализует ИАД средствами правдоподобных рассуждений вида «индукция - аналогия - абдукция».

Актуальность диссертационного исследования обусловлена необходимостью решения прикладных и фундаментальных задач в онкологии при помощи ИАД. Так, прогнозирование заболевания важно в клинической практике для планирования лечебного процесса и превентивной терапии, а открытие ключевых механизмов возникновения и развития злокачественной опухоли необходимо для создания новых препаратов и методов лечения.

Предметом исследования диссертации являются методы ИАД, реализуемые при помощи ИС на основе ДСМ-метода АПИ и их практическая применимость для задач онкологии.

Цель диссертационной работы:

- разработка на базе ДСМ-метода автоматизированной поддержки научных исследований (АПИ) методов и средств автоматизированного порождения новых знаний из постоянно накапливаемых эмпирических данных и знаний (knowledge discovery);

- применение ДСМ-метода АПИ в качестве процедурной платформы для автоматизированной компьютерной поддержки исследований в онкологии;

- разработка реализующей ДСМ-метод АПИ интеллектуальной компьютерной системы;

- экспериментальная апробация разработанной компьютерной интеллектуальной системы (обоснование ее практической применимости к области анализа онкологических данных).

В соответствии с этими целями определены следующие задачи исследования:

• идентифицировать требующие применения интеллектуального анализа данных (ИАД) актуальные задачи исследуемой предметной области -анализа постоянно накапливаемых разнородных онкологических данных с целью поддержки принятия требующие применения ИАД врачебных решений;

• разработать результативные средства представления данных, составляющих базу фактов (БФ), в том числе генетических данных пациентов с онкологическим диагнозом;

• реализовать в разрабатываемом программном инструментарии ИАД основные стратегии ДСМ-метода АПИ (простое сходство, сходство с

запретом на контр-примеры, сходство-различие, сходство-различие с запретом на контр-примеры), а также их объединение;

• реализовать необходимые вспомогательные процедуры ДСМ-решателя: выявление эмпирических закономерностей - таких эмпирических зависимостей (формируемых в процессе компьютерных рассуждений гипотез), которые сохраняются при всех перестановках последовательных расширений БФ и обеспечивают правильные предсказания на тестовых данных, проверку непротиворечивости наборов гипотез, фильтры гипотез для удобства их перебора и проверки экспертом и др.;

• разработать реализующую ДСМ-рассуждение интеллектуальную систему для анализа онкологических данных, имеющую комфортный (в том числе - для пользователей, не являющихся ИТ-экспертами) графический пользовательский интерфейс;

• реализовать функции направленной навигации в диаграмме гипотез в рамках концепции приближенного ДСМ-метода АПИ, позволяющие пользователю в интерактивном режиме быстро (за короткое время) проверять текущую БФ на предмет наличия в ней (пусть и в неявном виде) содержательно интерпретируемых гипотез;

• провести апробацию разработанной ИС посредством проведения экспериментов на реальных исходных данных онкологических пациентов, содержащих в том числе и их генетические, и иммунные персонифицированные характеристики.

Для решения вышеперечисленных задач использовались следующие методы: неклассическая (многозначная) логика, правдоподобные рассуждения, порождающие гипотезы о причинах эффектов и гипотезы о предсказаниях наличия или отсутствия эффектов, формализация рассуждений, формализация познавательных процедур, операции определения сходства, программная реализация приложений.

Информационной базой исследования являются перечисленные в списке используемой литературы научные работы по ДСМ-методу АПИ, и информация о постановке прикладных задач, полученная от экспертов предметной области.

Основные научные результаты, полученные в ходе исследования:

1. Разработана интеллектуальная система - компьютерный программный инструментарий интеллектуального анализа данных (ИАД), позволяющий в автоматическом и\или диалоговом режиме порождать новые знания из постоянно накапливаемых эмпирических данных (реализовать knowledge discovery).

2. При помощи развиваемого подхода и программной системы ИАД получены новые знания в клинической и молекулярно-генетической онкологии, имеющие прикладную и фундаментальную значимость, которые, согласно анализу научных источников, до настоящего времени не удавалось получить иными методами анализа данных.

3. Предложен результативный способ представления разнородных данных (генетических, количественных, клинических и прочих медицинских), используемых в онкологии, и предназначенный для ИАД, эффективность которого подтверждена экспериментами по предсказанию эффектов и получению новых знаний.

4. Разработан ДСМ-решатель задач, реализующий все основные стратегии ДСМ-метода АПИ: метод простого сходства, метод сходства с запретом на контр-примеры, метод сходства-различия, метод сходства-различия с запретом на контр-примеры, а также объединение всех стратегий для повышения полноты предсказания.

5. Созданы программные инструменты, которые на языке программирования python осуществляют синтез познавательных процедур ДСМ-метода АПИ: индукции, аналогии и абдукции.

6. Экспериментально подтверждено, что созданные программные инструменты ИС результативно применимы для исследуемой предметной области (клинической и молекулярно-генетической онкологии).

7. Созданы вспомогательные программные инструменты для определения непротиворечивости массивов порожденных гипотез для основных стратегий ДСМ-рассуждений и для всех возможных последовательностей расширений баз фактов.

8. Реализована функция направленной навигации в диаграмме сходств описаний прецедентов в рамках концепции приближенного ДСМ-метода, обеспечивающая в интерактивном режиме быстрый поиск интерпретируемых гипотез в исходной БФ путем направленного восстановления цепочек частичного порядка в диаграмме гипотез.

9. Разработанная интеллектуальная программная система для анализа онкологических данных обеспечена удобным графическим пользовательским интерфейсом, позволяющим не являющемуся ИТ-специалистом пользователю работать с ДСМ-решателем.

Первая ДСМ-система для анализа онкологических данных, которая при

этом, в отличие от представленной системы, не анализировала генетические

данные, была создана в ФИЦ ИУ РАН О.П. Шестерниковой, при помощи

языка программирования С# [1]. С ее помощью проводится дифференциация

заболеваний поджелудочной железы - хронического панкреатита и рака

поджелудочной железы, а также формирование групп риска среди пациентов

[2]. ДСМ-решатель данной системы выполняется на бытовом компьютере

пользователя в последовательном режиме, и поддерживает прямой атомарный

ДСМ-метод АПИ, реализующий все возможные стратегии, без их

объединения. Также создана полнофункциональная система для

прогнозирования возникновения диабета III типа у пациентов с панкреатитом,

которая имеет клиническое применение и используется в учреждениях

здравоохранения в качестве системы поддержки принятия врачебных решений

10

[1]. Также созданы еще две системы на основе ДСМ-метода АПИ, работы над которыми еще полностью не завершены: это система, предназначенная для применения в психиатрии с целью выявления связи психических расстройств (депрессия, тревога, расстройство образа тела, стигматизация) и кожного заболевания, и система для социологии, предназначенная для обработки данных соцопросов и исследований. В целом, ДСМ-метод АПИ неоднократно использовался для интеллектуального анализа медицинских данных с целью диагностики и прогнозирования различных заболеваний, прогнозирования канцерогенности химических элементов, и других подобных задач.

Научная новизна диссертационного исследования работы определяется следующим:

• реализовано автоматизированное получение новых знаний в онкологии, что имеет прикладную значимость в онкологической предметной области, как в клиническом (прогноза состояния пациента), так и в фундаментально-научном (открытие новых молекулярно-генетических механизмов возникновения и развития злокачественных опухолей) направлениях;

• предложен единый способ представления генетических и прочих медицинских данных в БФ, допускающий их совместное использование в процессе ИАД. Эффективность данного способа представления данных подтверждается успешными проведенными экспериментами по ИАД для решения задач молекулярной онкологии в части прогнозирования развития заболевания и поиска новых механизмов развития злокачественных опухолей;

• сформировано объединение всех реализованных стратегий ДСМ-метода АПИ, в результате чего достигнуто повышение полноты предсказания;

• впервые в формате ИС реализована функция направленной навигации в диаграмме сходств в рамках концепции приближенного ДСМ-метода АПИ

в виде ИС, который осуществляет построение цепочек частичного порядка в диаграмме гипотез за сравнительно короткое время, что позволяет эксперту быстро проверить исходную БФ на наличие содержательных гипотез, до применения полного ДСМ-метода АПИ;

• впервые интеллектуальная система (ИС) на основе ДСМ-метода АПИ адаптирована для работы на промышленном вычислительном кластере, что дало существенное сокращение вычислительного времени, и продемонстрировало возможность запуска ДСМ-метода АПИ на высокопроизводительных суперкомпьютерах подобного класса;

• реализовано параллельное выполнение процедур ДСМ-решателя задач сразу на 3 уровнях: эффект, стратегии, возможные перестановки расширений;

• в программной реализации ИС использован язык python, являющийся одним из наиболее распространенных, что потенциально расширяет круг исследователей, способных проводить адаптацию ИС под собственные нужды, а также позволяет проводить несложную интеграцию с другими модулями.

Полученные результаты и программные инструменты формируют научный задел, и могут служить основой для дальнейших научных исследований в области ИАД в онкологии. Разработанная ИС обладает значительной степенью универсализации, что означает возможность ее адаптации под другие предметные области.

Практическая значимость диссертационного исследования состоит в следующем:

• создана компьютерная интеллектуальная система на базе ДСМ-метода АПИ, которая позволяет пользователю (исследователю предметной области) проводить интеллектуальный анализ онкологических данных с

целью прогнозирования заболевания и выявления ключевых биологических механизмов возникновения и развития злокачественной опухоли;

• система позволяет оперировать реальными исследовательскими данными, в том числе - постоянными пополнениями текущих эмпирических данных вновь получаемыми сведениями;

• реализовано прогнозирование онкологического заболевания «меланома кожи», то есть выявление пациентов, у которых ожидается наступление состояния «ремиссия» (отсутствие признаков заболевания), а также тех пациентов, у которых ожидается наступление состояния «рецидив» (наличие признаков заболевания). Данная возможность позволяет клиническим специалистам НМИЦ онкологии им. Н.Н. Блохина выявлять пациентов с повышенным риском развития рецидива, которые классифицируются в группу усиленного мониторинга;

• выполнена классификация ранее неизвестных нарушений генов ДНК (мутаций) в соответствии с их патогенным влиянием на организм пациента: выявление среди них таких мутаций, которые влияют на характер заболевания. Данная задача важна с точки зрения определения новых прогностических факторов, необходимых для планирования стратегии лечения, а также выявления биологических механизмов онкологического заболевания с целью разработки новых противоопухолевых препаратов;

• в процессе экспериментов были выявлены нарушения генов, которые ранее не были известны в качестве вносящих весомый вклад в возникновение и развитие заболевания меланомы;

• реализована функция направленной навигации по диаграмме сходств, в

рамках приближенного ДСМ-метода АПИ, позволяющая пользователю

быстро находить в общем массиве гипотез такие гипотезы, которые

обладают интересующими эксперта свойствами, что также позволяет

проверять исходную БФ на предмет наличия интерпретируемых гипотез.

13

Функция была протестирована экспертами НМИЦ онкологии им. Н.Н.

Блохина и используется ими для решения исследовательских задач.

Разработанная программная система может быть использована для ведения ИАД также и в ряде других значимых предметных областей при решении задач диагностического типа (в технической диагностике, противодействии мошенничествам в банковской и финансовой сфере, обеспечении кибербезопасности и т.п.).

Апробация результатов диссертации. Основные положения

диссертационной работы были изложены на конференции «Интеллектуальные

системы в гуманитарной сфере. Опыт преподавания и развитие

образовательных программ» в рамках международного научно-практического

форума «Россия в XXI веке: глобальные вызовы, риски и решения» (29 мая

2019 г., РГГУ) в виде доклада «Методы интеллектуального анализа данных в

онкологии и их использование в образовательном процессе», в рамках

которого была представлена постановка задачи, а также результаты по

предсказанию неизвестных примеров и выявлению причинно-следственных

отношений в исходном массиве данных. На международной конференции

«Меланома и опухоли кожи-2018» (18-19 мая 2018 г., Москва Holiday Inn

Лесная) в рамках выступления «Прогнозирование ответа на терапию и

динамики заболевания с помощью молекулярно-генетического

профилирования опухоли» были представлены возможности метода и

доложены первые результаты классификации пациентов и определения

значимых для заболевания генов. На конференции «25 лет научных

исследований и образовательных программ Отделения интеллектуальных

систем в гуманитарной сфере» (18 декабря 2017 г., РГГУ) была представлена

постановка задачи и обоснование применимости ДСМ-метода АПИ для ее

решения, а также разработанный формат представления исходных данных. На

ежегодной конференции «Tumor Immunology and Immunotherapy - 2020»

Американской ассоциации исследования рака (American Association for Cancer

14

Research) (19-20 октября 2020, в виртуальном режиме) был представлен постерный доклад "Method for predicting the effectiveness of the developed immune dendritic cell vaccine in melanoma patients based on cell surface antigens and machine learning with non-classical logic".

В результате работы над онкологическими данными создана компьютерная ИС, реализующая стратегии ДСМ-метода АПИ. Подана заявка на внесение системы в Реестр программ для ЭВМ в Федеральную службу по интеллектуальной собственности (РОСПАТЕНТ).

Созданная ИС используется в Национальном медицинском исследовательском центре онкологии имени Н.Н. Блохина» Министерства здравоохранения Российской Федерации (ФГБУ «НМИЦ онкологии им. Н.Н. Блохина» Минздрава России для решения прикладных задач в виде прогнозирования онкологических заболеваний (выявления групп риска для применения усиленного мониторинга) а также поиска новых биомаркеров возникновения и развития злокачественных опухолей.

Публикации. По теме диссертации на текущий момент опубликовано 4 статьи в сборниках Научно-техническая информация, Серия 2 (Информационные процессы и системы), рекомендованных ВАК. Все они также были переведены на английский язык и опубликованы в журнале Automatic Documentation and Mathematical Linguistic.

Публикации автора по теме диссертации:

1) Чебанов Д.К., Михайлова И.Н. Интеллектуальный анализ данных пациентов с меланомой для поиска маркеров заболевания и значимых генов // Научно-техническая информация. Сер. 2. - 2019. - № 10 - С. 3540; D. K. Chebanov and I. N. Mikhaylova. Intellectual Mining of Patient Data with Melanoma for Identification of Disease Markers and Critical Genes // Automatic Documentation and Mathematical Linguistics, 2019, Vol. 53, No. 5, pp. 283-287.

2) Чебанов Д.К, Михайлова И.Н. Интеллектуальная система для анализа онкологических данных, реализующая ДСМ-метод автоматизированной поддержки исследований // Научно-техническая информация. Сер. 2. -2020. - № 5 - С. 19-29; D. K. Chebanov and I. N. Mikhaylova. An Intelligent System for Analyzing Oncological Data that Implements the JSM Method for Automated Research Support // Automatic Documentation and Mathematical Linguistics, 2020, Vol. 54, No. 3, pp. 130-139.

3) Чебанов Д.К. Об особенностях реализации ДСМ-метода для интеллектуального анализа данных // Научно-техническая информация. Сер. 2. - 2020. - № 7 - С. 21-26; D. K. Chebanov. On the Features of Implementation of the Solver of the JSM Method for Intellectual Data Analysis // Automatic Documentation and Mathematical Linguistics, 2020, Vol. 54, No. 4, pp. 196-201.

4) Чебанов Д.К., Михайлова И.Н. О методах искусственного интеллекта для анализа онкологических данных // Научно-техническая информация. Сер. 2. - 2020. - № 9 - С. 21-26; D. K. Chebanov and I. N. Mikhaylova. On the Methods of Artificial Intelligence for Analysis of Oncological Data // Automatic Documentation and Mathematical Linguistics, 2020, Vol. 54, No. 5, pp. 255-259.

Отдельные результаты включались в отчеты по проектам РФФИ: проект № 18-29-03063 мк «Комплекс методов и средств интеллектуального анализа слабоструктурированных данных для медицины и социологии» 2018-2021 гг., проект № 17-07-00539 А «Интеллектуальная система для обнаружения эмпирических закономерностей в последовательностях баз фактов» 2016-2019 гг.

Структура диссертационного исследования. Текст диссертации состоит из введения, пяти глав, заключения, списка литературы, списка иллюстраций (рисунков и таблиц) и трех приложений, и насчитывает 121 страницу.

1. ОБЗОР МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ОНКОЛОГИЧЕСКИХ ДАННЫХ И ПОСТАНОВКА ЗАДАЧИ

1.1. Обзор методов искусственного интеллекта, применяемых для

анализа онкологических данных

1.1.1. Обзор актуальных задач в сфере исследования и лечения

онкозаболеваний

Современное здравоохранение, в ответ на новые вызовы, связанные с совершенствованием технологических средств диагностики и повышением продолжительности жизни, требует внедрения новых подходов, среди которых наибольшую распространенность набирает концепция «3П»: персонифицикация, профилактика, предиктивность. Ответственность за реализацию одного из наиболее важных компонентов, - предиктивности, -лежит в сфере интеллектуального анализа данных, с помощью которого возможно реализовывать предсказания, связанные с будущим изменением параметров здоровья пациента.

Основными задачами, требующими решения в современной онкологии, являются определение риска возникновения злокачественной опухоли или ее рецидива, и предсказание состояния пациента (прогноз развития заболевания). В задачу определения прогноза также входит проблема выявления молекулярных механизмов (в частности, вовлеченных в них генов), которые вносят ключевой вклад в возникновение и развития заболевания: с помощью таких результатов можно подобрать персонализированную высокоточную терапию, обладающую высокой эффективностью, а также внести вклад в разработку новых препаратов.

Для пациентов, находящихся в ремиссии заболевания, крайне важно определить риски возникновения рецидива, что необходимо для индивидуального планирования схемы наблюдения или принятия решения о превентивном лечении. На решение данных задач направлены, например,

методы определения риска и предсказание развития опухоли, как, например, в исследовании для рака молочной железы [9].

Прогнозирование развития онкологического заболевания является важнейшей задачей [10]. Прогнозирование заболевания может быть представлено в виде задачи регрессии, когда имеет место предсказание времени выживаемости пациентов, к примеру с раком молочной железы [11] и с опухолями головы и шеи [12], либо как задача бинарной классификации в виде предсказания преодоления пациентами 5-летней выживаемости, что реализовано на примере множественной миеломы [13]. Одним из способов прогнозирования заболевания является классификация подтипов рака молочной железы по генетическим и клиническим данным, что информативно для определения прогноза развития заболевания [14].

Иммунотерапия является одним из наиболее перспективных направлений лечения онкозаболеваний: многие исследователи называют ее главным прорывом десятилетия в онкологии. При этом до сих пор отсутствуют строгие критерии применения данного типа лечения, при использовании которых можно было бы однозначно определять целесообразность его применения. В этой связи важно выявлять таких пациентов, у которых ожидается положительный эффект от иммунотерапии, который превысит эффекты от других типов лечения. Исследователями решается задача предсказания иммунного ответа на опухоль в результате применения иммунотерапевтических препаратов, вместе с реакцией организма на радиотерапию [15].

Важным направлением, необходимым не только для прогнозирования состояния пациента, но и для создания новых лекарственных препаратов, является моделирование протекающих в опухоли метаболических процессов [16]. Так, работы [17,18] решают задачи протеин-протеиновых взаимодействий и определения статуса белков, что также важно при определения молекулярных мишеней для воздействия и перечня молекул, способных стать лекарствами.

Список литературы диссертационного исследования кандидат наук Чебанов Дмитрий Константинович, 2021 год

Список литературы

1. Агафонов М.А., Шестерникова О.П., Винокурова Л.В., Панкратова Е.С., Финн В.К. О принципах и логических средствах, реализуемых в интеллектуальной системе для гастроэнтерологии // Научно-техническая информация. Серия 2. - 2017. - № 3. - С. 16 - 39.

2. Шестерникова О.П., Финн В.К., Винокурова Л.В., Лесько К.А., Варварина Г.Г., Тюляева Е.Ю. Интеллектуальная система для диагностики заболеваний поджелудочной железы // Научно-техническая информация. Сер. 2. - 2019. - No 10. - С. 41-48; Shesternikova O.P., Finn V.K., Vinokurova L.V., Les'ko K.A., Varvanina G.G, Tyulyaeva E.Yu. An intelligent system for diagnostics of pancreatic diseases // Automatic documentation and mathematical linguis- tics. - 2019.

- Vol. 53, No 5. - Р. 288-291.

3. Финн В. К. Об эвристиках ДСМ-исследований (дополнения к статьям) // Научно-техническая информация. Сер. 2. - 2019. - No 10. - С.1-34; Finn V.K. On the Heuristics of JSM Research (Additions to Articles) // Automatic documentation and mathematical linguistics. - 2019. - Vol. 53, No 5. - Р. 250-282.

4. Финн В. К. Дистрибутивные решетки индуктивных ДСМ-процедур // Научно-техническая информация. Сер. 2. - 2014. - No 11. - С. 1-36; Finn V. K. Distributive lattices of inductive JSM procedures // Automatic documentation and mathematical linguistics. - Vol. 53, No 5. - Р. 265-296.

5. ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания / сост. О.М. Аншаков, Е.Ф. Фабрикантова; под. общ. ред. О.М. Аншакова. - М.: ЛИБРОКОМ, 2009.

- 433 с.

6. Финн В. К. Об определении эмпирических закономерностей посредством ДСМ-метода автоматического порождения гипотез //

Искусственный интеллект и принятие решений. - 2010. - No 4. - С. 4148.

7. Финн В.К., Шестерникова О.П. О новом варианте обобщенного ДСМ-метода автоматизированной поддержки научных исследований // Искусственный интеллект и принятие решений. - 2016. - No 1. - C. 5764.

8. Забежайло М.И. Приближенный ДСМ-метод на примерах // Научно-техническая информация. Сер.2. - 2014. - No10. - С.1-12.

9. Nindrea R.D., Aryandono T., Lazuardi L., Dwiprahasto I. Diagnostic accuracy of different machine learning algorithms for breast cancer risk calculation: a meta-analysis // Asian Pacific Journal of Cancer Prevention. -2018 (Jul. 27). - No 19(7). - P.1747-1752.

10.Xie G., Dong C., Kong Y., Zhong J.F., Li M., Wang K. Group lasso regularized deep learning for cancer prognosis from multi-omics and clinical features // Genes (Basel). - 2019. - No 10(3). - URL: https://www.ncbi.nlm.nih.gov/pmc/articles/ PMC6471789/

11.Chen H., Kodell R.L., Cheng K.F. et al. Assessment of performance of survival prediction models for cancer prognosis // BMC Medical Research Methodology. - 2012. - No 12. - URL: https://bmcmedresmethodol.biomedcentral.com/articl es/10.1186/14712288-12-102

12.Su J., Zhang Y., Su H., Zhang C., Li W. A recurrence model for laryngeal cancer based on SVM and gene function clustering // Acta Oto-Laryngologica. - 2017. - No 137(5). - P. 557-562.

13.Chen R., Garapati S., Wu D., Ko S., Falk S., Dierov D., Stasiw A., Opong A.S., Carson K.R. Machine learning based predictive model of 5-year survival in multiple myeloma autologous transplant patients // Blood. - 2019. - URL: https://ashpublications.org/ blood/article/134/Supplement_1/2156/427904/ Machine-Learning-Based-Predictive-Model-of-5-Year

14.Rhee S., Seo S., Kim S. Hybrid approach of relation network and localized graph convolutional filtering for breast cancer subtype classification // Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18). - URL:https://arxiv.org/abs/1711.05859

15.Kosinsky Y., Dovedi S.J., Peskov K., Voronova V., Chu L., Tomkinson H., Al- Huniti N., Stanski D.R., Helmlinger G. Radiation and PD-(L)1 treatment combinations: immune response and dose optimization via a predictive systems model // Journal for ImmunoTherapy of Cancer. - 2018. - No 1 - P. 6-17.

16.Eberhard O. Voit. Modelling metabolic networks using power-laws and S-systems // Essays in Bio- chemistry volume. - 2008. - No 45. - Р. 29-40.

17.Yanardag P., Vishwanathan S.V.N. Deep graph kernels. KDD '15 // Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. August 2015. - URL: https://dl.acm.org/doi/10.1145/2783258.2783417

18.Li H., Gong X., Yu H., Zhou C. Deep neural network based predictions of protein interactions using primary sequences // Molecules. - 2018. - No 23. -URL: https://www.researchgate.net/publication/ 326755315_Deep_Neural_Network_Based_Predictions_ of_Protein_Interactions_Using_Primary_Sequences.

19.Way G.P., Sanchez-Vega F., La K., Armenia J., Chatila W.K., Luna A., Sander A., Cherniack A.D., Mina M., Ciriello G., S c h u l t z N . Machine learning detects pan-cancer ras pathway activation in the cancer genome atlas // Cell Reports. - 2018. -Vol. 23, Iss.1 - P.172-180.

20.Ambwani G., Cohen A., Estevez M., Singh N., Adamson B., Nussbaum N.C., Birnbaum B. A machine learning model for cancer biomarker identification in electronic health records // Value in Health. - 2019. - Vol. 22, Iss. S1.

21.Интеллектуальная система для прогнозирования онкологического заболевания Tempus (США). - URL: https://www.tempus.com

22.Интеллектуальная система для прогнозирования онкологического заболевания Flatlron (США). - URL: https://flatiron.com/

23.Deist T.M., Dankers F.J.W.M., Valdes G., Wijsman R., Hsu I.C., Oberije C., Lustberg T., Van Soest J., Hoebers F., Jochems A., Naqa I. El, Wee L., Morin O., Raleigh D.R., Bots W., Kaanders J.H., Belderbos J., Kwint M., Solberg T., Monshouwer R., Bussink J., Dekker A., Lambin P. Machine learning algorithms for outcome prediction in (chemo) radiotherapy: An empirical comparison of classifiers // Medical Physics. - 2018. - No 45(7). - P. 34493459.

24.Enshaei A., Robson C.N., Edmondson R.J. Artificial intelligence systems as prognostic and predictive tools in ovarian cancer // Annals of Surgi- cal. -2015. - No 22(12). - Р. 3970-3975.

25.Michuda J., Leibowitz B., Amar-Farkash S., Bevis C., Breschi A., Kapilivsky J., Igartua C., Bell J.S.K., Beauchamp K.A., White K., Stumpe M., Beaubier N., Taxter T. Multi- modal prediction of diagnosis for cancers of un- known primary. AACR Annual Meeting 2020. Session P0.CL01.04 - Tumor Type-focused Translational Research Specific. Abstract 5423. - URL: https://www.abstractsonline.com/pp8/ ?sf122451697=1#!/9045/presentation/3059.

26.Wan N., Weinberg D., Liu T.Y. et al. Ma- chine learning enables detection of early-stage colo- rectal cancer by whole-genome sequencing of plasma cellfree DNA // BMC Cancer. - 2019. - No 19(1). - URL: https://bmccancer.biomedcentral.com/articles/ 10.1186/s12885-019-6003-8

27.База данных The Cancer Genome Atlas Program. - URL: https://www.cancer.gov/tcga

28.Ding W., Chen G., Shi T. Integrative analysis identifies potential DNA methylation biomarkers for pan-cancer diagnosis and prognosis // Epigenetics. - 2019. - No 14(1). - P. 67-80.

29.Kanehisa M., Goto S. KEGG: Kyoto encyclopedia of genes and genomes //

Nucleic Acids Research. - 2000. - No 28. - P. 27-30.

101

30.Manica M., Cadow J., Mathis R., Martinez M. R. PIMKL: pathway induced multiple kernel learning // NPJ Systems Biology and Applications. - 2019. -Vol. 5, No 8. - URL: https://arxiv.org/abs/ 1803.11274

31.Sanchez-Vega F., Mina M., Armenia J., Ciriello G., Sander C., Schultz N. et al. Oncogenic Signaling Pathways in the Cancer Genome Atlas // Cell. - 2018. - Vol. 173, Iss. 2 - P. 321-337.

32.Ma J., Ku Yu M., Fong S., Ono K., Sage E., Demchak B., Sharan R., Ideker T. Using deep learning to model the hierarchical structure and function of a cell // Nature Methods. - 2018. - Vol. 15. - P. 290-298.

33.Friedman N., Linial M., Nachman I., Pe'er D. Using bayesian networks to analyze expression data. Proceedings of the Fourth Annual International Conference on Computational Molecular Biology. - 2000. - URL: https://www.cs.huji.ac.il/~nir/Papers/ FLNP1Full.pdf

34.3аридзе Д.Г. Канцерогенез. - М.: Медицина, 2004. - С. 184-185.

35.Финн В.К., Шестерникова О.П. Эвристика обнаружения эмпирических закономерностей посредством ДСМ-рассуждений // Научно-техническая информация. Сер. 2. - 2018. - No 9. - С.7-42; V. K. Finn and O. P. Shesternikova. The Heu- ristics of Detection of Empirical Regularities by JSM Reasoning // Automatic Documentation and Mathematical Linguistics. - 2018. - Vol. 52, No 5. - P. 215-247.

36.Аншаков О.М. ДСМ-метод: теоретико-множественное объяснение // Научно-техническая информация. Сер. 2. - 2012. - No 9 - С. 1-19

37.Шестерникова О.П., Агафонов М.А., Винокурова Л.В., Панкратова Е.С., Финн В.К. Интеллектуальная система прогнозирования развития сахарного диабета у больных хроническим панкреатитом // Искусственный интеллект и принятие решений. - 2015. - No4. - С.12-50.

38.Биркгоф Г. Теория решеток. - М.: Наука, 1989.

39.Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. -Berlin: Springer, 1999.

40.Kuznetsov S.O., Obiedkov S.A. Comparing performance of algorithms for generating concept lattices // Journal of Experimental and Theoretical Artificial Intelligence. - 2002. - Vol. 14. - P. 189-216.

41.Чебанов Д.К., Михайлова И.Н. Интеллектуальный анализ данных пациентов с меланомой для поиска маркеров заболевания и значимых генов // Научно-техническая информация. Сер. 2. - 2019. - No 10 - С. 3540; Chebanov D.K. Mikhailova I.N. Intellectual mining of patient data with melanoma for identification of disease markers and critical genes // Automatic documentation and mathematical linguistics. - Vol. 53, No 5. - Р. 283-288.

42.Gao J., Aksoy B.A., Dogrusoz U., Dresdner G., Gross B., Sumer S.O., Sun Y., Jacobsen A., Sinha R., Larsson E., Cerami E., Sander C., Schultz N. Integrative Analysis of Complex Cancer Genomics and Clinical Profiles Using the cBioPortal // Science Signaling. - 2013. - Vol. 6, Issue 269. - Р.11

43.Cerami E., Gao J., Dogrusoz U., Gross B.E., Sumer S.O., Aksoy B.A., Jacobsen A., Byrne C.J., Heuer M.L., Larsson E., Antipin Y., Reva B., Goldberg A.P., Sander C., Schultz N. The cBio Cancer Genomics Portal: An Open Platform for Exploring Multidimensional Cancer Genomics Data // Cancer Discov. - 2012. - Vol. 2(5). - P. 401-404.

Список иллюстраций

Рис. 1. Отношение предикатов, правил правдоподобного вывода и

стратегий ДСМ-метода АПИ...30

Рис. 2. Пример фрагмента диаграммы сходств ... 30

Рис.3. Процедурная блок-схема ДСМ-метода АПИ .32

Рис.4. Пример организации всех возможных перестановок для БФ с

одним расширением. 33

Рис.5. Схема организации параллельных потоков на этапе порождения гипотез...41

Рис.6. Схема организации параллельных потоков на этапе предсказания примеров..42

Рис. 7. Схема организации поиска пересечений примеров в рамках одного расширения БФ...47

Рис. 8. Архитектура интеллектуальной системы .56

Рис.9. Общий вид пользовательского интерфейса Системы (главный экран)...60

Рис.10. Общий вид пользовательского интерфейса Системы (экран приближенного расчета)...61

Табл. 1. Сокращенный вид таблицы, содержащей представление генетических (генотипических) данных...68

Табл. 2. Фрагмент исходных данных по иммунному статусу пациентов.71

Табл. 3. Сокращенный вид таблицы, содержащей представление иммунных (иммунотипических) данных...73

Табл. 4. Правильные предсказания и ошибки для стратегий при исследовании БФ без иммунных данных...76

Табл. 5. Таблица правильных предсказаний и ошибок для стратегий при исследовании БФ с иммунными данными...77

Табл. 6. Правильные предсказания примеров стратегиями (обозначены «1»), для БФ без иммунных данных...78

Табл. 7. Количество гипотез и эмпирических закономерностей, участвовавших в правильных предсказаниях... 79

Приложение А. Интеллектуальная система для анализа онкологических данных. Руководство пользователя

Оглавление

1. Назначение системы 1

2. Технические требования 2

3. Установка системы 2

4. Подготовка системы к запуску 2

5. Запуск системы 2

6. Работа с системой 2

6.1. Полный ДСМ-метод АПИ 2

6.2. Приближенный ДСМ-метод АПИ 3

7. Возможные ошибки и предупреждения при работе с программой 5

8. Завершение работы с программой 5

1. Назначение системы

Интеллектуальная система для анализа онкологических данных (далее -Система) предназначена для проведения исследований с использованием ДСМ-метода автоматизированной поддержки исследований (ДСМ-метода АПИ). Система состоит из следующих компонентов: база фактов, база знаний, решатель задач (ДСМ-решатель), пользовательский интерфейс. Система позволяет работать с данными трех типов, используемых в онкологии: клиническими, генетическими, иммунными. К Системе прилагаются примеры документов представления входных данных и полученных результатов. Возможности пользователя при работе с Системой включают в себя реализацию следующих функций:

• Применение ДСМ-метода АПИ: вычисление эмпирических закономерностей на исходной БФ, со всеми возможными перестановками, при помощи 16 стратегий.

• Применение приближенного метода: вычисление границ диаграммы, образованной БФ, а также цепочек частичного порядка внутри диаграммы, с целью установления возможности интерпретируемости гипотез, получаемых из массива исходных данных.

• Сортировка полученных гипотез по количеству признаков, либо по количеству подтверждающих примеров, для удобства представления результатов эксперту.

• Расшифровка индексов признаков, и получение индекса по названию признака, с целью обнаружения новых закономерностей.

2. Технические требования

• ОС Windows XP/7 и выше / MacOS 10 и выше

• 60 Мб свободной памяти на жестком диске

• Установленная среда python 3, с библиотеками pandas, pyQt, multiprocessing, time

• Microsoft Office Excel, версия не ниже 2003

3. Установка системы

Для установки программы необходимо скопировать на пользовательский компьютер папку с файлами программы (Intellectual_System_Oncology), в которой содержатся все необходимые библиотеки и папка с примерами исходных данных.

4. Подготовка системы к запуску

Перед запуском Системы необходимо сохранить исходный массив данных в формате .xls(x) в общей папке с файлами Системы (см. Раздел 3),

принимая во внимание структуру массива данных source_dataset_example.xlsx, находящегося в данной папке в качестве примера правильного формата представления исходных данных

5. Запуск системы

1) Через терминал войти в скопированную на компьютер папку с файлами программы (см. Раздел 3)

2) Запустить в терминале файл системы main_module.py при помощи команды python main_module.py

6. Работа с системой

6.1. Полный ДСМ-метод АПИ

Пользовательский интерфейс Системы показан на Рис. 1 (главный экран) и Рис. 2. (экран приближенного расчета).

Для проведения эксперимента необходимо осуществить запуск ДСМ-решателя, что достигается с помощью следующих шагов:

1) В пользовательском интерфейсе (Рис.1) выбрать знак гипотез (либо отметить оба знака),

2) Нажать кнопку «Вычислить». В результате происходит запуск ДСМ-

решателя. После завершения расчета (указатель мыши перестанет

сигнализировать о процессе вычисления) можно перейти в папку с

результатами расчета. Результаты эксперимента сохраняются в папку,

предназначенную для хранения результатов эксперимента (папка

hypotheses, находящаяся в папке с файлами Системы). Внутри данной

папки находятся подпапки, соответствующие стратегиям из

нижеследующего списка, в которых присутствуют комбинации следующих

предикатов: простое сходство (обозначается a), сходство с запретом на

108

контр-примеры (обозначается Ь), упрощённый метод сходства-различия (обозначается d0)

3) Stгa,a, 2) Strab,a, 3) Strad0,a, 4) Strad0b,a, 5) Stra,ab, 6) Strab,ab, 7) Strad0,ab, 8) Stгad0b,ab, 9) Stra,ad0, 10) Stгab,ad0, 11) Stгad0,ad0, 12) Strad0b,ad0, 13) Stгa,ad0b, 14) Strab,ad0b, 15) Stгad0,ad0b,16) Stгad0b,ad0b.

4) В папке с файлами Системы появляются файлы с результатами экспериментов по всем 16 стратегиям, включающие эмпирические закономерности (ЭЗК).

5) При помощи кнопки Загрузить осуществляется обработка гипотез фильтрами, для возможности удобного просмотра полученных результатов экспертом.

6) Поскольку признаки зашифрованы индексами, для возможности чтения гипотез и закономерностей экспертом в Системе предусмотрен модуль расшифровки гипотез, при помощи которого эксперт может ввести интересующую его гипотезу в окно в блоке «Расшифровка номеров признаков», после чего получить в окне слева от текущего названия признаков в исходных терминах поставленной задачи.

6.2. Функция направленной навигации по диаграмме гипотез

Для реализации функции направленной навигации по диаграмме гипотез в рамках концепции приближенного ДСМ-метода АПИ необходимо нажать на кнопку «Цепочки» в верхней части экрана. В результате данного интерактивного режима работы, согласно командам эксперта-пользователя будут пошагово вычисляться гипотезы, принадлежащие цепочкам частичного порядка полной диаграммы гипотез.

1) Выбрать указатель, соответствующий нижней (гипотезы с наибольшим количеством примеров) или верхней (гипотезы с наибольшим числом признаков) границе диаграммы.

2) Нажать кнопку «Вычислить».

3) В окне результатов под кнопкой «Вычислить» появится перечень гипотез, которые эксперт может сохранить, либо вставить ее в окно под надписью «Введите гипотезу и найдите связанные с ней гипотезы».

4) Кнопками «Больше признаков» и «Меньше признаков» осуществляется навигация по диаграмме гипотез. Те из гипотез, которые эксперт считает интерпретируемыми, он может сохранить.

5) Для расшифровки гипотезы в терминах исходной задачи необходимо вставить гипотезу в нижнее окно, после чего в окне результатов слева появятся значения, соответствующие введенным номерам признаков.

6) В качестве подсказки при поиске интерпретируемых гипотез эксперт может нажать кнопку «Вывести все признаки и их номера», после чего в окне результатов появится список номеров признаков с их расшифровкой.

ф ф Ма1гМ/шс1о«у

Цепочки

Вычисление всех возможных гипотез на обучающей выборке

® Минус Вычислить Плюс-гипотезы: Минус-гипотезы: Загрузить

Примените фильтры, введя признаки через ',' Гипотезы:^! Плюс I Минус

Должны содержать эти признаки:

Остается:

~ Вывести

Не должны содержать эти признаки:

Число признаков: ф больше Г меньше равно О С

Число родителей, не меньше:

Навигация - поиск гипотез с меньшим либо большим числом признаков, отталкиваясь от ввеаенного набора признаков

Введите гипотезу, и найдите связанные гипотезы. Либо введите интересующий набор признаков, и узнайте его статус:

Больше признаков Меньше признаков

Слишком много результатов? Примените фильтры, введя признаки через : Оставить содержащие эти признаки: Убрать содержащие эти признаки:

Мы искали введенный Вами набор признаков целиком. Попробуйте снизить порог поиска: совпадение может быть меньше на О С признаков Искать

Вывести все признаки и их номера Или введите номер признака, либо гипотезу целиком:

Или выберите интересующий признак, и будет определен его номер: Ьаде О

Расшифровка номеров признаков

Рис.1. Общий вид пользовательского интерфейса Системы (главный экран)

• • МаЬМЛпским

Цепочки

Все гипотезы

Вычисление начальных наборе* гипотез. Выберите тип гипотез, которые планируется вычислить: О с наибольшим количеством подтверждающих примеров ("родителей"), но с наименьшим числом признаков с наибольшим числом признаков, но с наименьшим количеством подтверждающих примеров ("родителей")

Вычислить Всего в окне: О сортировать по количеству примеров-родителей (сначала - наибольшие)

сортировать по количеству признаков в гипотезе (сначала - короткие)

Слишком много результатов? Примените фильтры, введя признаки через : Оставить содержащие эти признаки: Убрать содержащие эти признаки:

Вы можете скопировать любую гипотезу и вставить в окно в блоке "Навигация"

навигация - поиск гипотез с меньшим либо большим числом признаков, отталкиваясь от введенного набора признаков Введите гипотезу, и найдите связанные гипотезы. Либо введите интересующий набор признаков, и узнайте его статус:

Больше признаков Меньше признаков

Слишком много результатов? Примените фильтры, введя признаки через ',': Оставить содержащие эти признаки: Убрать содержащие эти признаки:

Расшифровка номеров признаков

Мы искали введенный Вами набор признаков целиком. Попробуйте снизить порог поиска: совпадение может быть меньше на О С признаков Искать

Вывести все признаки и их номера Или введите номер признака, либо гипотезу целиком:

Или выберите интересующий признак, и будет определен его номер: Ьаде О

Рис.2. Общий вид пользовательского интерфейса Системы (экран приближенного расчета)

7. Возможные ошибки и предупреждения при работе с программой

Во всех случаях, когда требуется указать данные, кнопки управления будут неактивны. Если клавиши недоступны к нажатию, необходимо проверить наличие исходных данных в соответствующем окне ввода.

При отсутствии файлов в папках результатов после проведения расчета следует убедиться в правильности структуры входного файла, руководствуясь примером в исходной комплектации Системы.

При возникновении ошибок, не описанных в настоящем руководстве, просьба направлять их описание на электронную почту разработчика: chebanov.dk@gmail.com

8. Завершение работы с программой

Чтобы закрыть диалоговое окно, необходимо нажать в его верхнем углу на кнопку с изображение крестика или красного кружка.

Приложение Б. Результаты эксперимента

Таблица 4

Примеры правильных предсказаний

Пример Пример Пример Пример

№402 №399 №395 №402

Признаки Мутация Мутация Мутация

Мутация ROS1 BRAF ROS1

N^8 Мутация Мутация Мутация

Мутация BRAF FAT4 KSR2

Мутация Мутация Мутация

Мутация FAT3 NOTCH4 HMCN1

БЛТ2 Мутация Мутация Пол -

Мутация PTEN HIPK2 мужской

СИБ8 Мутация Мутация Стадия по

Мутация HMCN1 NF1 AJCC - III

ЯЛС1 Мутация Мутация или выше

Мутация PDGFRA MFNG

СИБ4 Мутация Возраст -

Мутация TAOK1 свыше 58

РРР2И1Л Мутация лет

Мутация ALK Пол -

БКК1 Мутация мужской

Мутация DTX4 Стадия по

ЯЛ8Л3 Пол: AJCC - III

Возраст - мужской или выше

свыше 58 Общая

лет выживаемос

Пол - ть - свыше

мужской Общая 36 мес.

выживаемос

ть - свыше

36 мес.

Зафиксиров

ана

прогрессия заболевания

Число стратегий, 16 16 12 8

предсказавших

пример правильно

Фактический (+) (+) (-) (-)

эффект примера

Число гипотез 305 316 81 14

верного знака,

вложившихся в

пример

Число гипотез 56 43 71 1

противоположного

знака,

вложившихся в

пример

Число ЭЗК, (+): 6 (+): 8 (+): 1 (+): 0

участвовавших в (-): 0 (-): 0 (-): 1 (-): 1

предсказании

Таблица 5

Неправильные предсказания

Пример №392 Пример №396 Пример №404

Признаки Мутация Мутация Мутация MGA

DLL4 NCOR1 Мутация ROS 1

Мутация Мутация NF1 Мутация

NRAS Мутация BRAF

Мутация TAOK2 Мутация TLE1

DVL1 Возраст - Мутация FAT3

Мутация свыше 58 лет Мутация CRB1

LGR5 Пол - мужской Мутация FAT4

Возраст - Стадия по Мутация

свыше 58 лет AJCC - III или DCHS2

Пол - выше Мутация DVL2

мужской Зафиксирована Мутация

Стадия по прогрессия FGFR2

AJCC - III или заболевания Мутация

выше CHD8

Зафиксирован Мутация CRB3

а прогрессия Мутация

заболевания CBLB

Мутация

THBS2

Мутация TSC1

Мутация SPEN

Мутация

ARAF

Мутация

LLGL2

Мутация 8ТК4

Мутация

8РИЕБ2

Мутация

ШРР4Б

Мутация

WNT5Л

Мутация

СТБР1

Мутация

WNT16

Мутация

CCNE1

Мутация ЬИР6

Мутация

ЛШБЛ

Мутация ИР86

Мутация

СБК4

Мутация

БСН81

Мутация ИБХ1

Пол: мужской

Общая

выживаемость

- свыше 36

мес.

Число стратегий, 12 12 16

предсказавших пример

неправильно

Фактический эффект (+) (-) (-)

примера

Число гипотез 20 103 2923

противоположного

знака, вложившихся в

пример

Число гипотез верного 24 72 464

знака, вложившихся в

пример

Таблица 6

Обнаруженные эмпирические законы, участвовавшие в правильных предсказаниях, и имеющие физический смысл по результатам анализа экспертом (БФ без иммунных данных), с примерами комментариев экспертов

(-)-ЭЗ:

• ZNRF3, IFNA1 (Комментарий эксперта: ген ZNRF3 кодирует белок трансмембранного рецептора, который вовлечен а активацию сигнального пути, ген IFNA1 кодирует интерферон-альфа, -важнейший компонент иммунной системы).

• ZNRF3, RPS6, CCND1 (Комментарий эксперта: ген ZNRF3

кодирует белок трансмембранного рецептора, который вовлечен а

активацию сигнального пути, ген RPS6 кодирует рибосомальный

протеин, вовлеченный в множество заболеваний и активизирующий

онкогенный путь TOR, ген CCND1 кодирует одну из циклин-зависимых

киназ, что часто встречается в злокачественных процессах, а также

участвует в онкогенном пути Hedgehog).

117

• DLL4, CDK4, IFNA1 (Комментарий эксперта: ген DLL4 кодирует предшественника важного протеина и активирует онкогенный сигнальный путь NOTCH, ген CDK4 является важнейшим онкогеном, вызывает наследственные опухолевые синдромы, и кодирует циклин-зависимую киназу-4).

• DLL4, CCND1, CDK4, IFNA1

• ZNRF3, CCND1, IFNA1

(+)-ЭЗ:

• ZNRF3, STK3, CCND1, IFNA1, MFAP5

• STK3, CCND1, IFNA1, MFAP5

• STK3, LLGL1, CCND1, MFAP5

• STK3, IFNA1, MFAP5

• STK3, LLGL1, MFAP5

• PTGS2, STK3, MFAP5

• TNFRSF11B, IFNA1, MFAP5

• ZNRF3, CCND 1, IFNA1, MFAP5

• LLGL1, PSEN2, MFAP5

• ZNRF3, PSEN2, MFAP5

• ZNRF3, STK3, IFNA1, MFAP5

• STK3, LLGL1, PSEN2, MFAP5

• STK3, WIF1, MFAP5

• TNFSF13B, MFAP5

• PSEN2, CCND1, IFNA1, MFAP5

• TNFRSF11B, CCND1, MFAP5

• ZNRF3, PSEN2, CCND1, MFAP5

• WNT3A, CCND 1, MFAP5

• ZNRF3, IFNA1, MFAP5

• STK3, PSEN2, MFAP5

• STK3, LLGL1, PSEN2, CCND1, MFAP5

• DLL4, PSEN2, MFAP5

• STK3, LTB, MFAP5

• PSEN2, RPS6, MFAP5

• LTB, CCND1, MFAP5

(Общий комментарий эксперта: система сигнальных путей является чрезвычайно разветвлённой, и ученым очень трудно отследить комбинацию нарушений в этих сигнальных путях, приводящих к заболеванию. Представленный метод позволяет обнаружить комбинацию нарушений, которая непосредственно приводит к эффекту: ремиссии или рецидиву, то есть развитию заболевания).

Таблица 7

Обнаруженные эмпирические законы, участвовавшие в правильных предсказаниях, и имеющие физический смысл по результатам анализа экспертом (БФ с иммунными данными)

(+)-ЭЗ:

• MGA, Общая выживаемость - свыше 36 мес

• CRB1, FAT4, Общая выживаемость - свыше 36 мес

• ROS 1, FAT3, Общая выживаемость - свыше 36 мес

• FAT3, CRB1, FAT4, Общая выживаемость - свыше 36 мес

• FAT4, FAT1, Общая выживаемость - свыше 36 мес

• CDH4, FAT4, Общая выживаемость - свыше 36 мес

• STAT4, Общая выживаемость - свыше 36 мес

• NF1, Общая выживаемость - свыше 36 мес

• SPEN, Общая выживаемость - свыше 36 мес

• FAT3, CRB1, Мужской пол, Общая выживаемость - свыше

36 мес

• БИАБ, БАТ1, Общая выживаемость - свыше 36 мес

• РЬХКБ1, Общая выживаемость - свыше 36 мес

• БАТ3, ИМСШ, Общая выживаемость - свыше 36 мес

• БАТ3, СИБ1, БАТ4, Мужской пол, Общая выживаемость -свыше 36 мес

• БСИ82, Общая выживаемость - свыше 36 мес

• КЯА8, БАТ4, Общая выживаемость - свыше 36 мес

• БАТ3, 8РЕК, Общая выживаемость - свыше 36 мес

• БАТ3, СИВ 1, Общая выживаемость - свыше 36 мес

• БИАБ, БАТ4, Мужской пол, Общая выживаемость - свыше 36 мес

• БАТ3, БАТ4, Общая выживаемость - свыше 36 мес

• ИМС№, Общая выживаемость - свыше 36 мес

(-)-ЭЗ:

• БИАБ, Возраст свыше 58 лет, Мужской пол

• КЯА8, А1СС выше III, Возникновение образований после первичного лечения

• КЯА8, Мужской пол, А1СС выше III, Возникновение образований после первичного лечения

Приложение В. Перечень предикатов

Обо-значение Наименование Формула

а+ Простое сходство М ^3к ММя (УЖк), где мп ^жк)^ ... 37^зи1... зи ((l/(l;И)(Zl^lUl)&_&J(l;И)(Zk^lUk)&(Zln_ nZk =V) &(^0) &"/у/(((/*у)&(1< i, j < k))®(Zl■*Z^■))&VXVY ((/(1,и)(Х^1У)& (^Х)) &(^0)&( V (Х=£))))& (к >2)) г = 1

Ь+ Запрет на контр-примеры М +6>я ^ М & (Ь)+, где (Ь)+ VXVY (((^Х) & ® (/аи)(Х^^) V /(^)(Х^)))

do+ Упрощенный метод сходства-различия М^,ягде do^VXVYVZVU((/(l;И)(X^lY) & & (VcX)&((X\V)cZ)& ((Х\У>0)&-^^))) ® (- /и) ^^и) V - ^сЦ)))

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат наук Чебанов Дмитрий Константинович

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

"Совершенствование онкологической помощи по ранней диагностике меланомы кожи"2023 год, доктор наук Неретин Евгений Юрьевич

Разработка и внедрение системы искусственного интеллекта в лучевой диагностике очаговых образований в легких2022 год, доктор наук Мелдо Анна Александровна

Введение диссертации (часть автореферата) на тему «Прогнозирование ремиссии или рецидива у онкологических больных, реализуемое в интеллектуальной системе»

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Методы, модели и технология обеспечения жизнеспособности интеллектуальных систем с декларативными базами знаний2021 год, доктор наук Шалфеева Елена Арефьевна

Методы, модели и технология обеспечения жизнеспособности интеллектуальных систем с декларативными базами знаний2021 год, доктор наук Шалфеева Елена Арефьевна

Модели и алгоритмы обработки слабоструктурированных текстовых данных на основе методов искусственного интеллекта2023 год, кандидат наук Макарова Елена Андреевна

Список литературы диссертационного исследования кандидат наук Чебанов Дмитрий Константинович, 2021 год