Метод графовой кластеризации для совместного анализа данных генотипирования и экспрессии генов тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Лобода Александр Александрович
- Специальность ВАК РФ00.00.00
- Количество страниц 233
Оглавление диссертации кандидат наук Лобода Александр Александрович
Оглавление
Реферат
Synopsis
Введение
ГЛАВА 1 ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
1.1 Полногеномный поиск ассоциаций
1.2 Методы кластеризации многомерных данных
1.3 Методы графовой кластеризации при анализе биологических данных
1.4 Способы проведения теста ассоциации при наличии популяционной структуры в данных
1.5 Методы семплирования комбинаторных объектов
1.5.1 Эвристики для ускорения сходимости метода
Метрополиса-Гастингса
1.6 Байесовские сети
1.6.1 Оценочные функции
1.6.2 Дискретизация переменных
1.7 Задача смешанного целочисленного программирования
1.7.1 Метод ветвей и границ
1.7.2 Лагранжева релаксация
1.8 Задачи, решаемые в диссертационной работе
Выводы по главе
ГЛАВА 2 МЕТОД ПОИСКА ГРАФА ЗАВИСИМОСТЕЙ
МЕЖДУ ЭКСПРЕССИЯМИ ГЕНОВ
2.1 Теоретическое обоснование
2.2 Применение алгоритма Метрополиса-Гастингса
2.3 Реализация метода
2.3.1 Выбор гиперпараметров
2.3.2 Программная реализация разработанных методов
2.4 Использование метода поиска графа зависимостей для вывода
генных регуляторных сетей
2.4.1 Результаты экспериментов с использованием метода
построения графов зависимости
2.5 Оптимизация алгоритма семплирования
2.5.1 Метод предсказания перехода
2.5.2 Структура распределения переходов
2.5.3 Переходы, соответствующие инвертированию ребер
2.5.4 Эвристический подход для проверки графа на ацикличность
2.5.5 Практическое исследование
Выводы по главе
ГЛАВА 3 МЕТОД ПРОВЕРКИ СТАТИСТИЧЕСКИХ
ГИПОТЕЗ В РАСПРЕДЕЛЕННЫХ СИСТЕМАХ ПРИ НАЛИЧИИ ПЕРСОНАЛЬНЫХ ДАННЫХ ГЕНОТИПИРОВАНИЯ
3.1 Формулировка задачи
3.2 Описание предлагаемого метода
3.3 Детали реализации
3.4 Применение метода при работе с данными генотипирования
3.5 Практическое тестирование
3.5.1 Когорта больных раком груди
3.5.2 Когорта европейских субпопуляций
3.5.3 Когорта финнов
Выводы по главе
ГЛАВА 4 МЕТОД ГРАФОВОЙ КЛАСТЕРИЗАЦИИ ДЛЯ СОВМЕСТНЫХ ДАННЫХ
ГЕНОТИПИРОВАНИЯ И ЭКСПРЕССИИ ГЕНОВ
4.1 Схема предлагаемого метода
4.2 Решение обобщенной задачи поиска связного подграфа максимального веса
4.3 Применение лагранжевой релаксации для решения сигнальной задачи связного подграфа максимального веса
4.3.1 Переформулировка задачи в терминах смешанного целочисленного программирования
4.3.2 Эвристическое решение
4.3.3 Добавление ограничений
4.3.4 Фиксация переменных
4.4 Практическое применение
4.4.1 Анализ хромосомной делеции 22д11
4.4.2 Анализ когорты больных раком груди
Выводы по главе
Заключение
Список рисунков
Список таблиц
Приложение А - Тексты публикаций
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Методы вычислительного анализа метаболических моделей для интерпретации транскриптомных и метаболомных данных2016 год, кандидат наук Сергушичев, Алексей Александрович
Разработка методов картирования генов на основе родословных сложной структуры2010 год, кандидат биологических наук Белоногова, Надежда Михайловна
Разработка и исследование гибридных методов решения задач проектирования систем и устройств информатики, моделируемых графовыми моделями2001 год, кандидат технических наук Старостин, Николай Владимирович
Исследование разреженной модели базовых блоков для оптимизации потока команд вычислительного конвейера2007 год, кандидат технических наук Довгалюк, Павел Михайлович
Разработка и применение методов полногеномного анализа генетических ассоциаций сложных признаков2010 год, доктор биологических наук Аульченко, Юрий Сергеевич
Введение диссертации (часть автореферата) на тему «Метод графовой кластеризации для совместного анализа данных генотипирования и экспрессии генов»
Общая характеристика диссертации
Актуальность темы исследования. Кластеризация является одной из важных задач при обработке и анализе многомерных данных. Однако, из-за большого разнообразия в происхождении, видах данных, а также целей, которые ставятся в разных предметных областях, не существует универсального подхода к решению этой задачи, как и строгого определения задачи.
Одной из важнейших предметных областей является биология, где в результате развития технических возможностей получения информации на клеточном и молекулярном уровнях образовались большие наборы данных, описывающие состояния живых систем. Широкое распространенение процедур генотипиро-вания в различных формах способствовало развитию таких областей, как популяционная и медицинская генетика, изучающие, в том числе, наследственные причины различных заболеваний человека.
Одним из основных инструментов в популяционной генетике является полногеномный поиск ассоциаций (GWAS, genome-wide association study). Он заключается в том, что выполняется статистическое сравнение генотипов людей в двух когортах: тестовой - людей с рассматриваевым заболеванием, и контрольной - здоровых людей. В результате этого сравнения определяются геномные позиции, ассоциированные с заболеванием: те позиции, в которых наблюдается статистически значимая разница в частотах генотипов в тестовой и контрольной когортах.
При изучении заболеваний и поиске лекарств наибольший интерес представляют гены - функциональные участки генома, в то время, как геномные позиции, найденные в результате GWAS-исследования чаще лежат вне генов. В результате возникает задача о поиске гена, на функционирование которого влияет изменение генотипа в ассоциированной с заболеванием позиции. Эта задача осложняется тем, что сигнал ассоциации для позиции может быть важен не сам по себе, а лишь скоррелирован с функционально важной позицией,
которая может оставаться незаметной с точки зрения теста ассоциации. В целом, на сегодня задача остается актуальной и активно исследуемой в научном сообществе1.
Задачу поиска функциональных связей между генами и заболеваниями можно рассматривать как задачу кластеризации. В этом случае кластером может являться набор генов, функционально связанных с этим заболеванием. При этом, близость генов в кластере может наблюдаться как на уровне результатов GWAS-исследований, так и, например, в близости в графе межгенных взаимодействий.
Ранее графовый подход уже был успешно применен к задаче анализа данных генотипрования2. В этой работе было продемонстрировано, что функционально важные гены склонны к образованию связных кластеров в графе межгенных взаимодействий. Однако в этой работе рассматривался анализ предопределенного набора генов, в то время как поиск такого набора функционально важных генов и является первоочередной задачей.
Таким образом, разработка методов графой кластеризации является актуальной и перспективной темой исследований. Решение задачи графовой кластеризации может помочь в определении генов, функционально связанных с заболеваниями. В свою очередь, это поможет лучшему пониманию разивиятия заболеваний, способов их лечения и предотвращения.
Степень разработанности темы исследования. Ранее в работе3 был разработан метод GAM-кластеризации для поиска так называемых метаболических модулей, связных подграфов в графе биохимичесих реакций, по данным экспрессии генов. Однако этот подход не применим напрямую для совместного анализа данных генотипирования и экспрессии генов в контексте поиска генов, функционально связнных с заболеваниями.
1 Gallagher, M. D. The post-GWAS era: from association to function / M. D. Gallagher, A. S. Chen-Plotkin // The American Journal of Human Genetics. 2018. Т. 102, № 5. С. 717—730; Korte, A. The advantages and limitations of trait analysis with GWAS: a review / A. Korte, A. Farlow // Plant methods. 2013. Т. 9, № 1. С. 1—9.
2Jia, P. Network-assisted analysis to prioritize GWAS results: principles, methods and perspectives / P. Jia, Z. Zhao. 2014.
3Гайнуллина, А. Н. Метод графового анализа транскриптомных данных для обнаружения метаболической регуляции иммунных клеток [Текст] : дис. ... канд. техн. наук : 05.13.17 / Гай-нуллина А. Н. Санкт-Петербург, 2020.
Во-первых, в отличие от графов биохимических реакций графы межгенных взаимодействий более плотные и менее структурированные. Это выражается, например, в наличии связей между генами, не являющихся функционально значимыми в контексте рассматриваемого заболевания. Перспективным направ-
«4
лением является использование генных регуляторных сетей , которые можно строить по данным экспрессии генов специфичным для заболевания образом. Однако задача построения генных регуляторных сетей по данным экспрессии генов является нерешенной и требует разработки более эффектиных и качественных методов.
Во-вторых, данные экспрессии генов не являются персональными в отличие от используемых в GWAS-исследованиях данных генотипрования. На данный момент во избежание ложно-положительных результатов тестовая и контрольная когорты вручную поправляются на популяционные и технические систематические различия. Из-за того, что данные генотипироавния явлюятся персональными, GWAS-исследования проводится в рамках одного исследовательского центра или консорциума. Это препятствует использованию более эффективного подхода, в котором одна и та же контрольная когорта могла бы быть использована для многих GWAS-исследований.
Целью данной работы является разработка и исследования метода графовой кластеризации для данных генотипирования с использованием графа зависимостей, выводимого по данным значений экспрессии генов. Для достижения поставленной цели сформулированы следующие задачи:
1. Разработка метода для извлечения графа зависимостей из многомерных данных значений экспрессии генов.
2. Разработка метода для проведения статистических тестов в распределенных системах для персональных генетических данных с систематическим смещением.
3. Разработка метода графовой кластеризации данных на основе графов зависимостей и результатов статистических тестов для генетических данных.
4Revealing strengths and weaknesses of methods for gene network inference / D. Marbach [et al.] // Proceedings of the national academy of sciences. 2010. Vol. 107, no. 14. P. 6286—6291.
Положения, выносимые на защиту:
1. Метод для построения графов зависимостей между уровнями экспрессии генов посредством семплирования Байесовских сетей.
2. Метод для проведения статистических тестов с систематическим отклонением при групповом анализе персональных данных.
3. Метод графовой кластеризации, позволяющий выделить гены, функционально связанные с заболеванием, на основе анализа графа межгенных взаимодействий и результатов ОШЛЯ-исследования.
Научная новизна:
1. В работе впервые предложен вероятностный подход к задаче построения графа зависимостей, конкурирующий с используемыми методами для решения этой задачи. Вероятностная формулировка позволяет интегрировать полученный граф в успешно применяемые методы графовой кластеризации.
2. В работе разработан метод для проведения групповых статистических тестов для персональных генетических данных. Впервые стало возможно в автоматическом режиме проводить полногеномный поиск ассоциаций для многоцентровых исследований посредством передачи только аггреги-рованных данных.
3. В работе впервые разработан подход к графовой кластеризации совместного анализа данных генотипирования и экспрессии генов.
Соответствие паспорту специальности Работа находится в соответствии с паспортом специальности 2.3.8 — «Информатика и информационные процессы» и относится к пункту 13: «Разработка и применение методов распознавания образов, кластерного анализа, нейро-сетевых и нечетких технологий, решающих правил, мягких вычислений при анализе разнородной информации в базах данных».
Методы исследования. В работе используются методы кластерного анализа, анализа данных, дискретной математики, теории вероятности и статистики, линейной алгебры.
Теоретическая значимость заключается в разработанных методах для задач графовой кластеризации, вывода графов зависимостей по данным, методе проведения статистических тестов в условиях анализа персональных данных, доказательствах для времени работы алгоритмов и их корректности.
Практическая значимость состоит в следующем:
1. Разработан метод для проведения статистических тестов в данных со систематическим смещением при условии персональной природы данных. Метод реализован в виде R-пакета (https://github.com/alexloboda/ SVDFunctions) и веб-сервиса, содержащего контрольную базу из 39 472 образцов для проведения полногеномного поиска ассоциаций (http:// dnascore.net).
2. Разработан метод для поиска графа зависимостей в данных реализован в виде программы на языке Java и может быть использован для широкого круга задач при анализе данных (https://github.com/alexloboda/bns).
3. Разработаны практические решатели для вариантов задачи поиска связного подграфа максимального веса реализованы в виде R-пакета mwcsr и размещены в центральном репозитории пакетов CRAN (https://cran. rstudio.com/web/packages/mwcsr/index.html).
4. Разработаны методы, позволяющие проводить интерпретацию данных полногеномного поиска ассоциаций, что было продемонстрировано, например, для данных по синдрому делеции 22q115.
Достоверность научных положений, выводов и практических рекомендаций. Временные оценки методов, а также корректность методов подтверждается математическими доказательствами. Основные положения и практические рекомендации находят отражение в публикациях в рецензируемых журналах и конференциях, в том числе из списка Scopus и Web of Science.
Апробация результатов исследования. Результаты исследований были представлены в качестве выступлений на следующих международных и всероссийских конференциях:
5The 22q11. 2 region regulates presynaptic gene-products linked to schizophrenia / R. Nehme [и др.] // Nature communications. 2022. Т. 13, № 1. С. 1—21.
1. Loboda A.A., Artomov N.M., Artyomov M.M. Daly M.J. A platform for case-control matching enables association studies without genotype sharing. // BGRS/SB-2022: The 13rd International Conference "On Bioinformatics of Genome Regulation and Structure/Systems Biology Novosibirsk, Russia, July 8, - 2022.
2. Loboda A., Artomov M., Artomov M., Daly M.Public platform with 42,291 exome control samples enables association studies without genotype sharing (Abstract/Program 98) // 69th Annual Meeting of The American Society of Human Genetics, October 17, Houston., IET - 2019, pp. 137
3. Loboda A., Artomov M., Daly M., Sergushichev A.Algorithm for gene regulatory network inference recovers biological insights from large-scale gene expression data (Abstract/Program 1426) // 69th Annual Meeting of The American Society of Human Genetics, October 18, Houston., IET - 2019, pp. 1207
4. Лобода А.А., Сергушичев А.А. Определение структуры генной регулятор-ной сети по профилям экспрессии генов // VII Конгресс молодых ученых (КМУ) (17.04.2018 - 20.04.2018)
5. Лобода А.А., Сергушичев А.А. Эффективный выводд стуктуры генной ре-гуляторной сети по эксперссиям генов. // VIII Конгресс молодых ученых (КМУ) (15.04.2019 - 19.04.2019)
Личный вклад автора состоит в разработке и реализации метода для проведения статистических тестов в условиях анализа персональных данных, идея применения сигнулярного разложения для сокращения размерности принадлежит Артемову Н.М. Автором также разработан и реализован метод для построения графов завимостей и проведение экспериментального тестирования. Методы для решения задачи связного подграфа максимального веса разрабатывались и реализовывались вместе с научным руководителем Сергу-шичевым А.А. Правила предобработки для решателей задачи поиска связного подграфа максимального веса, не описанные в данной работе, разработаны совместно с Попереченым Н.А. и описаны им в бакалаврской диссертации.
Внедрение результатов работы. Результаты работы использованы при выполнении проектов «Вычислительные методы для системной биологии» (при поддержке программы «Приоритет 2030»), «Разработка алгоритмов анализа метаболических и сигнальных сетей для идентификации модулей, регулирующих клеточную адаптацию» (договор 2.3300.2017/ПЧ), «Биоинформатика, машинное обучение, технологии программирования, теория кодирования, проактив-ные системы» и «Методы, модели и технологии искусственного интеллекта в биоинформатике, социальных медиа, киберфизических, биометрических и речевых системах» (в рамках государственной финансовой поддержки ведущих университетов Российской Федерации, субсидия 074-Ш1 и субсидия 08-08).
Объем и структура работы. Диссертация состоит из ввдедения, четырех глав, заключения и одного приложения. Объем диссертации - 227 страниц с 15 рисунками и 2 таблицами. Список литературы содержит 0 наименований.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Математические модели и алгоритмы в исследованиях связи между структурой и свойствами органических соединений2007 год, доктор физико-математических наук Скворцова, Мария Ивановна
Построение алгоритмов ортогонального представления графа с указанными портами рёбер2005 год, кандидат физико-математических наук Ворожцов, Артём Викторович
Оптимизация межресурсного обмена при сборке данных в распределённых GRID-вычислениях на основе сетевых и суперкомпьютерных технологий2012 год, кандидат технических наук Амиршахи Бита
Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов2008 год, кандидат технических наук Крижановский, Андрей Анатольевич
Разработка и исследование методов и алгоритмов для моделирования адаптивных веб-ресурсов на основе нечетких ультраграфов2005 год, кандидат технических наук Целых, Алексей Александрович
Заключение диссертации по теме «Другие cпециальности», Лобода Александр Александрович
Заключение
В работе представлен полностью вероятностный метод для решения задачи вывода генных регуляторных сетей из данных экспрессии генов путем вычисления оценки на частные вероятности вхождения каждого ребра в искомую генную регуляторную сеть, представленную в виде байесовской сети. Этот подход не требует вычисления крайне трудных задач оптимизации, как в случае с нахождением оптимальной байесовской сети или лучшей дискретизационной политики. Показано, что метод может быть реализован посредством применения метода Монте-Карло на основе марковских цепей. Предложенный метод протестирован на симулированных экземплярах задачи из соревнования DREAM4 Challenges и может быть использован как сам по себе, так и в ансамбле с другими методами.
Предложенный подход имеет важное значение - он предоставляет вероятности для каждого ребра и легко может быть расширен для любых априорных распределений генных регуляторных сетей, что может быть использовано при адаптации метода к экспериментам другого вида. Так, будущая работа может быть направлена на получения таких априорных вероятностей из данных экспериментов по нокауту генов и по подавлению активности некоторых генов.
Исходный код метода доступен на веб-странице https://github.com/alexloboda
GENIE3
работа
RGBM
GENIE3 работа
RGBM
0,5
Чувствительность
Рисунок. Графики кривых точности и чувствительности для методов GENIE3, RGBM и предложенного метода. Графики а—д соответствуют пяти симулированным экземплярам 1-5 задачи из набора ^Шсо_100_ти1Ш:аСюпа1
Список литературы диссертационного исследования кандидат наук Лобода Александр Александрович, 2022 год
Литература
1. Csermely P., Ägoston V., Pongor S. The efficiency of multi-target drugs: the network approach might help drug design // Trends in Pharmacological Sciences. 2005. V. 26. N 4. P. 178-182. doi: 10.1016/j.tips.2005.02.007
2. Schaffter T., Marbach D., Floreano D. GeneNetWeaver: in silico benchmark generation and performance profiling of network inference methods // Bioinformatics. 2011. V. 27. N 16. P. 2263-2270. doi: 10.1093/bioinformatics/btr373
3. Marbach D., Costello J.C., Küffner R., Vega N.M., Prill R.J., Camacho D.M., Allison K.R., Kellis M., Collins J.J., Aderhold A., Stolovitzky G., Bonneau R., Chen Y., Cordero F., Crane M., Dondelinger F., Drton M., Esposito R., Foygel R., De La Fuente A., Gertheiss J., Geurts P., Greenfield A., Grzegorczyk M., Haury A.-C., Holmes B., Hothorn T., Husmeier D., Huynh-Thu V.A., Irrthum A., Karlebach G., Lebre S., De Leo V., Madar A., Mani S., Mordelet F., Ostrer H., Ouyang Z., Pandya R., Petri T., Pinna A., Poultney C.S., Rezny S., Ruskin H.J., Saeys Y., Shamir R., Sirbu A., Song M., Soranzo N., Statnikov A., Vega N., Vera-Licona P., Vert J.-P., Visconti A., Wang H., Wehenkel L., Windhager L., Zhang Y., Zimmer R. Wisdom of crowds for robust gene network inference // Nature Methods. 2012. V 9. N 8. P. 796-804. doi: 10.1038/nmeth.2016
4. Friedman N., Linial M., Nachman I., Pe'er D. Using Bayesian networks to analyze expression data // Journal of Computational Biology. 2000. V. 7. N 3-4. P. 601-620. doi: 10.1089/106652700750050961
5. Aghdam R., Ganjali M., Zhang X., Eslahchi C. CN: a consensus algorithm for inferring gene regulatory networks using the SORDER
References
1. Csermely P., Ägoston V., Pongor S. The efficiency of multi-target drugs: the network approach might help drug design. Trends in Pharmacological Sciences, 2005, vol. 26, no. 4, pp. 178-182. doi: 10.1016/j.tips.2005.02.007
2. Schaffter T., Marbach D., Floreano D. GeneNetWeaver: in silico benchmark generation and performance profiling of network inference methods. Bioinformatics, 2011, vol. 27, no. 16, pp. 2263-2270. doi: 10.1093/bioinformatics/btr373
3. Marbach D., Costello J.C., Küffner R., Vega N.M., Prill R.J., Camacho D.M., Allison K.R., Kellis M., Collins J.J., Aderhold A., Stolovitzky G., Bonneau R., Chen Y., Cordero F., Crane M., Dondelinger F., Drton M., Esposito R., Foygel R., De La Fuente A., Gertheiss J., Geurts P., Greenfield A., Grzegorczyk M., Hauiy A.-C., Holmes B., Hothorn T., Husmeier D., Huynh-Thu V.A., Irrthum A., Karlebach G., Lebre S., De Leo V., Madar A., Mani S., Mordelet F., Ostrer H., Ouyang Z., Pandya R., Petri T., Pinna A., Poultney C.S., Rezny S., Ruskin H.J., Saeys Y., Shamir R., Sirbu A., Song M., Soranzo N., Statnikov A., Vega N., Vera-Licona P., Vert J.-P., Visconti A., Wang H., Wehenkel L., Windhager L., Zhang Y., Zimmer R. Wisdom of crowds for robust gene network inference. Nature Methods, 2012, vol. 9, no. 8, pp. 796-804. doi: 10.1038/nmeth.2016
4. Friedman N., Linial M., Nachman I., Pe'er D. Using Bayesian networks to analyze expression data. Journal of Computational Biology, 2000, vol. 7, no. 3-4, pp. 601-620. doi: 10.1089/106652700750050961
5. Aghdam R., Ganjali M., Zhang X., Eslahchi C. CN: a consensus algorithm for inferring gene regulatory networks using the SORDER
algorithm and conditional mutual information test // Molecular BioSystems. 2015. V. 11. N 3. P. 942-949. doi: 10.1039/c4mb00413b
6. Husmeier D. Sensitivity and specificity of inferring genetic regulatory interactions from microarray experiments with dynamic Bayesian networks // Bioinformatics. 2003. V. 19. N 17. P. 2271-2282. doi: 10.1093/bioinformatics/btg313
7. Liu F., Zhang S.-W., Guo W.-F., Wei Z.-G., Chen L. Inference of gene regulatory network based on local bayesian networks // PLoS Computational Biology. 2016. V. 12. N 8. P. e1005024. doi: 10.1371/journal.pcbi.1005024
8. Chen Y.-C., Wheeler T.A., Kochenderfer M.J. Learning discrete Bayesian networks from continuous data // Journal of Artificial Intelligence Research. 2017. V. 59. P. 103-132. doi: 10.1613/jair.5371
9. Buntine W. Theory refinement on Bayesian networks // Proc. 7 th Conference on Uncertainty in Artificial Intelligence. 1991. P. 52-60. doi: 0.1016/B978-1-55860-203-8.50010-3
10. Hastings W.K. Monte Carlo sampling methods using Markov chains and their applications // Biometrika. 1970. V. 57. N 1. P. 97-109. doi: 10.1093/biomet/57.1.97
11. Chib S., Greenberg E. Understanding the metropolis-hastings algorithm // American Statistician. 1995. V. 49. N 4. P. 327-335. doi: 10.1080/00031305.1995.10476177
12. Кормен Т.Х., Лейзерсон Ч.И., Ривест Р. Л., Штайн К. Алгоритмы: построение и анализ: [пер. с англ.]. М.: Издательский дом Вильямс, 2009. 1290 с.
13. Albert R. Scale-free networks in cell biology // Journal of Cell Science. 2005. V. 118. N 21. P. 4947-4957. doi: 10.1242/jcs.02714
14. Mall R., Cerulo L., Garofano L., Frattini V., Kunji K., Bensmail H., Sabedot T.S., Noushmehr H., Lasorella A., Iavarone A., Ceccarelli M. RGBM: regularized gradient boosting machines for identification of the transcriptional regulators of discrete glioma subtypes // Nucleic Acids Research. 2018. V. 46. N 7. P. e39. doi: 10.1093/nar/gky015
15. Petralia F., Wang P., Yang J., Tu Z. Integrative random forest for gene regulatory network inference // Bioinformatics. 2015. V. 31. N 12. P. i197-i205. doi: 10.1093/bioinformatics/btv268
algorithm and conditional mutual information test. Molecular BioSystems, 2015, vol. 11, no. 3, pp. 942-949. doi: 10.1039/c4mb00413b
6. Husmeier D. Sensitivity and specificity of inferring genetic regulatory interactions from microarray experiments with dynamic Bayesian networks. Bioinformatics, 2003, vol. 19, no. 17, pp. 2271-2282. doi: 10.1093/bioinformatics/btg313
7. Liu F., Zhang S.-W., Guo W.-F., Wei Z.-G., Chen L. Inference of gene regulatory network based on local bayesian networks. PLoS Computational Biology, 2016, vol. 12, no. 8, pp. e1005024. doi: 10.1371/journal.pcbi.1005024
8. Chen Y.-C., Wheeler T.A., Kochenderfer M.J. Learning discrete Bayesian networks from continuous data. Journal of Artificial Intelligence Research, 2017, vol. 59, pp. 103-132. doi: 10.1613/jair.5371
9. Buntine W. Theory refinement on Bayesian networks. Proc. 7ih Conference on Uncertainty in Artificial Intelligence, 1991, pp. 52-60. doi: 0.1016/B978-1-55860-203-8.50010-3
10. Hastings W.K. Monte Carlo sampling methods using Markov chains and their applications. Biometrika, 1970, vol. 57, no. 1, pp. 97-109. doi: 10.1093/biomet/57.1.97
11. Chib S., Greenberg E. Understanding the metropolis-hastings algorithm. American Statistician, 1995, vol. 49, no. 4, pp. 327-335. doi: 10.1080/00031305.1995.10476177
12. Cormen T.H., Leiserson Ch.E., Rivest R.L., Stein C. Introduction to Algorithms. McGraw-Hill, 2003, 1056 p.
13. Albert R. Scale-free networks in cell biology. Journal of Cell Science, 2005, vol. 118, no. 21, pp. 4947-4957. doi: 10.1242/jcs.02714
14. Mall R., Cerulo L., Garofano L., Frattini V., Kunji K., Bensmail H., Sabedot T.S., Noushmehr H., Lasorella A., Iavarone A., Ceccarelli M. RGBM: regularized gradient boosting machines for identification of the transcriptional regulators of discrete glioma subtypes. Nucleic Acids Research, 2018, vol. 46, no. 7, pp. e39. doi: 10.1093/nar/gky015
15. Petralia F., Wang P., Yang J., Tu Z. Integrative random forest for gene regulatory network inference. Bioinformatics, 2015, vol. 31, no. 12, pp. i197-i205. doi: 10.1093/bioinformatics/btv268
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.