Разработка системы анализа данных высокопроизводительного секвенирования для решения задач прецизионной онкологии тема диссертации и автореферата по ВАК РФ 03.01.09, кандидат наук Иванов Максим Вячеславович

  • Иванов Максим Вячеславович
  • кандидат науккандидат наук
  • 2020, ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)»
  • Специальность ВАК РФ03.01.09
  • Количество страниц 71
Иванов Максим Вячеславович. Разработка системы анализа данных высокопроизводительного секвенирования для решения задач прецизионной онкологии: дис. кандидат наук: 03.01.09 - Математическая биология, биоинформатика. ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)». 2020. 71 с.

Оглавление диссертации кандидат наук Иванов Максим Вячеславович

Оглавление

Список сокращений

Введение

Актуальность исследования

Цель исследования

Задачи работы

Научная новизна и практическая ценность работы

Основные положения диссертации, выносимые на защиту

Апробация работы

Глава 1. Обзор литературы

Онкологические заболевания. Общие положения

Молекулярные основы канцерогенеза

Прецизионная онкология

Роль высокопроизводительного секвенирования в молекулярной онкодиагностике

Геномные биомаркеры в сопутствующей онкодиагностике

Методологические основы анализа данных высокопроизводительного секвенирования

Методы детектирования генетических вариантов по результатам высокопроизводительного секвенирования

Методы детектирования соматических генетических вариантов по результатам

высокопроизводительного секвенирования

Глава 2. Материалы и методы

Дизайн апробационного исследования

Апробация метода оценки качества данных

Сбор образцов

Пробоподготовка и высокопроизводительное секвенирование

Апробация метода детектирования наследственных генетических вариантов

Сбор образцов

Детектирование генетических нарушений референсным методом

Пробоподготовка и высокопроизводительное секвенирование

Апробация метода детектирования соматических генетических вариантов в образцах опухоли

Сбор образцов

Детектирование генетических нарушений референсным методом

Пробоподготовка и высокопроизводительное секвенирование

Апробация метода детектирования вероятно соматических генетических вариантов в образцах плазмы крови

Сбор образцов

Детектирование генетических нарушений референсным методом

Пробоподготовка и высокопроизводительное секвенирование

Стороннее программное обеспечение для детектирования генетических вариантов

Глава 3. Результаты

Разработка модуля предварительной оценки качества данных

Реализация модуля предварительной оценки качества данных

Апробация модуля предварительной оценки качества данных

Апробация модуля предварительной оценки качества данных на симулированных данных

Апробация модуля предварительной оценки качества данных на данных высокопроизводительного секвенирования

Разработка модуля детектирования генетических вариантов

Реализация модуля детектирования генетических вариантов

Апробация модуля детектирования генетических вариантов

Апробация модуля детектирования генетических вариантов на симулированных данных

Апробация модуля детектирования генетических вариантов на образцах периферической крови

Апробация модуля детектирования генетических вариантов на опухолевых образцах пациентов

Апробация модуля детектирования генетических вариантов на образцах плазмы крови

Глава 4. Обсуждение результатов

Заключение

Выводы

Список литературы

Список сокращений

ДНК - дезоксирибонуклеиновая кислота сцДНК - свободно-циркулирующая ДНК н.п. - пара нкулеотидов

FFPE - зафиксированный формалином и залитый парафином ПЦР - полимеразная цепная реакция

MLPA - метод мультиплексной амплификации лигированных зондов

FDA - управление по контролю качества пищевых продуктов и лекарственных препаратов США ИГХ - иммуногистохимического метода исследования FSIH - флуоресцентная гибридизация in situ

NGS - высокопроизводительное секвенирование, секвенирование следующего поколения кб - 1000 пар оснований ДНК или РНК СКО - среднее квадратическое отклонение ОРУ - односайтовая расчетная чувствительность

Введение

Актуальность исследования

Стремительное развитие технологий высокопроизводительного секвенирования (NGS) за последнее десятилетие революционизировало как сферу научно-исследовательскую в области биотехнологий, так и рутинную практику диагностической молекулярно-генетической лаборатории. Технология NGS секвенирования позволяет определять нуклеотидную последовательность ДНК в масштабах всего генома организма или выбранных заранее регионов с недоступной ортогональным методам молекулярно-генетической диагностики уровнем точности, производительности и масштабируемости. Платформы NGS секвенирования последних версий позволяют получать объем информации, сопоставимый с размером генома человека в считанные часы [1], в то время как первые эксперименты по определению последовательности генома человека заняли около 10 лет [2]. Технология высокопроизводительного секвенирования уже сейчас используется в практике клинико-диагностических лабораториях в различных сферах медицины, включая онкологию, где анализ проводится не только для условно-здоровых людей с целью определения предрасположенности к онкологическим заболеваниям, но и для онкологических пациентов с целью определения потенциальной эффективности терапии, так и [3]. Так, комплексное молекулярное профилирование с применением технологии секвенирования следующего поколения уже сейчас рекомендовано европейским сообществом медицинских онкологов для пациентов с немелкоклеточным раком легкого, раком предстательной железы, раком яичников и холангиокарциномой [4]. Методы обогащения по целевым регионам ДНК при NGS секвенировании позволяют оптимизировать и упростить лабораторный технологический процесс.

Биоинформатический анализ данных является неотъемлемой частью технологического процесса высокопроизводительного секвенирования. Технология позволяет получать большой объем данных различного рода молекулярно-биологической информации, в то время как анализ этих данных позволяет отвечать на заранее поставленные исследователями вопросы. Процесс интеграции технологии в практику клинико-диагностической лаборатории, неизбежно сопровождается стандартизацией технологического процесса и формализацией решаемых задач. Уже сейчас управлением по контролю за продуктами питания и лекарственными средствами США зарегистрированы медицинские изделия

основанные на применении технологии N08 секвенирования с целью детектирования генетических вариантов. Однако зачастую условия эксперимента в практике клинико-диагностической лаборатории отличаются от привычных в научно-исследовательской сфере. Так, например, в рамках молекулярно-генетической диагностики исследуются только определенные ограниченные регионы генома вместо полноэкзомного или полногеномного секвенирования. К тому же зачастую отсутствует парный образец здоровой ткани ввиду экономических соображений. Также могут отличаться и исследуемые типы образцов (свежезамороженные образцы ткани опухоли, исследуемые в научно-исследовательской практике, позволяют выделять ДНК более высокого качества, в то время как в рутинной практике ведения онкологических пациентов распространенным методом хранения является фиксация в формалине с последующей парафинизацией образцов ткани). Все это, в купе с более высокими требованиями к чувствительности и специфичности к программному обеспечению требует разработки соответствующих методов анализа данных высокопроизводительного секвенирования и программных решений для стандартизации и контроля качества эксперимента.

Цель исследования

Разработка программного обеспечения для оптимизации, стандартизации и усовершенствования технологического процесса анализа данных высокопроизводительного секвенирования для решения задач прецизионной онкологии в отношении детектирования генетических вариантов (включая однонуклеотидные замены, короткие вставки и делеции и множественные нуклеотидные замены протяженностью не более 50 н.п.) в рамках рутинной практики клинико-диагностической лаборатории, осуществляющей сопутствующую диагностику онкологических заболеваний.

Рекомендованный список диссертаций по специальности «Математическая биология, биоинформатика», 03.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка системы анализа данных высокопроизводительного секвенирования для решения задач прецизионной онкологии»

Задачи работы

При решении задач прецизионной медицины требуется детектирование двух типов генетических вариантов (наследственные и соматические) в трех типах аналитов (геномная ДНК, выделенная из здорового образца ткани, геномная ДНК, выделенная из опухолевого образца, позволяющая с высокой точностью оценивать локальный молекулярный профиль заболевания и свободная ДНК, выделенная из жидкостной биопсии, позволяющая с низкой точностью оценивать интегральный молекулярный профиль заболевания). В соответствии с этим для достижения цели работы были определены следующие задачи:

1. Разработка алгоритма контроля качества данных высокопроизводительного секвенирования с целью оценки их пригодности для последующего поиска генетических вариантов.

2. Разработка алгоритма поиска генетических вариантов на основе данных; высокопроизводительного секвенирования с учетом распространенных условий технологического процесса клинико-диагностической лаборатории;

3. Программная реализация разработанных алгоритмов в виде отдельных модулей и в рамках автоматической системы анализа данных высокопроизводительного секвенирования;

4. Апробация разработанных методов контроля качества данных и детектирования генетических вариантов на симулированных данных;

5. Апробация программного обеспечения, разработанного на основе предложенных методов, в отношении поиска редких наследственных генетических вариантов на данных высокопроизводительного секвенирования, полученных в рамках рутинной практики клинико-диагностической лаборатории;

6. Апробация программного обеспечения, разработанного на основе предложенных методов, в отношении поиска соматических генетических вариантов в образцах опухоли онкологических больных на данных высокопроизводительного секвенирования, полученных в рамках рутинной практики клинико-диагностической лаборатории;

7. Апробация программного обеспечения, разработанного на основе предложенных методов, в отношении поиска вероятно соматических генетических вариантов в образцах жидкостной биопсии на данных высокопроизводительного секвенирования, полученных в рамках рутинной практики клинико-диагностической лаборатории.

Научная новизна и практическая ценность работы

1. Разработан уникальный алгоритм интегральной оценки качества данных высокопроизводительного секвенирования, учитывающий, свойственную для задач прецизионной онкологии, неэквивалентность геномных позиций и спектра ожидаемых генетических вариантов.

2. Разработанный алгоритм оценки качества данных секвенирования может применяться в практике клинико-диагностической лаборатории между этапами выравнивания данных секвенирования и детектирования генетических вариантов. Поскольку алгоритм позволяет получать интегральную оценку в форме единичного числа, он может использоваться для контроля качества в рамках простейших правил принятия решений на основе заранее определенных допустимых порогов.

3. Разработанный алгоритм оценки качества данных секвенирования позволяет помимо оценки их пригодности для последующего детектирования генетических вариантов также и выявить регионы ДНК, требующие дополнительного анализа, в случае низкого качества данных. Это может позволить избежать дополнительного дорогостоящего секвенирования в случае, если все проблемные регионы могут быть проанализированы ортогональными молекулярно-генетическими методами.

4. Разработанный алгоритм оценки качества данных секвенирования может также использоваться для количественного сравнения пригодности различных технологических лабораторных решений (включая методы пробоподготовки и обогащения по целевым регионам ДНК) для решения определенной задачи в рамках прецизионной онкологии или медицинской генетики.

5. Разработан уникальный алгоритм детектирования генетических вариантов (включая однонуклеотидные замены, короткие вставки и делеции и множественные нуклеотидные замены протяженностью не более 50 н.п.) по результатам высокопроизводительного секвенирования. Разработанный алгоритм позволяет использовать набор ранее проанализированных в рамках единого технологического процесса образцов с целью увеличения чувствительности детектирования вариантов без снижения специфичности за счет итеративного моделирования сайт-специфичного шума.

6. Разработанный алгоритм детектирования генетических вариантов может применяться в практике клинико-диагностической лаборатории вместе с другими методами детектирования генетических вариантов с целью увеличения чувствительности анализа вариантов из спектра заранее ожидаемых.

Основные положения диссертации, выносимые на защиту

1. Разработан и реализован алгоритм контроля качества данных высокопроизводительного секвенирования c целью оценки их пригодности для последующего поиска генетических вариантов.

2. Разработан и реализован алгоритм поиска генетических вариантов на основе данных высокопроизводительного секвенирования с учетом распространенных условий технологического процесса клинико-диагностической лаборатории

3. По результатам апробации разработанные методы могут использоваться в рамках технологического процесса клинико-диагностической лаборатории, осуществляющей лабораторную онкодиагностику с использованием технологии NGS с целью уменьшения вероятности ложно-отрицательных и ложно-положительных результатов.

Апробация работы

По теме диссертации опубликовано четыре работы в рецензируемых научных журналах:

1. Novel bioinformatics quality control metric for next-generation sequencing experiments in the clinical context / M. Ivanov, M. Ivanov, A. Kasianov, E. Rozhavskaya, S. Musienko, A. Baranova, V. Mileyko. // Nucleic Acids Res. - 2019. -Vol. 47, no. 21. - P.e135. [Индексируется Scopus, Web of Science, PubMed]

2. Utility of cfDNA Fragmentation Patterns in Designing the Liquid Biopsy Profiling Panels to Improve Their Sensitivity / M. Ivanov, P. Chernenko, V. Breder, K. Laktionov, E. Rozhavskaya, S. Musienko,

A. Baranova, V. Mileyko // Front Genet. - 2019. -Vol. 12, no. 10. - P.194. [Индексируется Scopus, Web of Science, PubMed]

3. Targeted sequencing reveals complex, phenotype-correlated genotypes in cystic fibrosis / M. Ivanov, A. Matsvay, O. Glazova, S. Krasovskiy, M. Usacheva, E. Amelina, A. Chernyak, M. Ivanov, S. Musienko, T. Prodanov, S. Kovalenko, A. Baranova, K. Khafizov // BMC Med Genomics. - 2018. -Vol. 11(Suppl 1), no. 13. [Индексируется Scopus, Web of Science, PubMed]

4. Towards standardization of next-generation sequencing of FFPE samples for clinical oncology: intrinsic obstacles and possible solutions / M. Ivanov, K. Laktionov, V. Breder, P. Chernenko, E. Novikova, E. Telysheva, S. Musienko, A. Baranova, V. Mileyko // J TranslMed - 2017. -Vol. 31, no. 15(1). - P.22. [Индексируется Scopus, Web of Science, PubMed]

Результаты представлены в материалах конференций:

1) Mileyko V., Ivanov M., Novikova E., Telysheva E., Chernenko P., Breder V., Laktionov K., Baranova A. NGS for precision medicine in non-small cell lung cancer: Challenges and opportunities. // Annals of Oncology. Copenhagen. 01 October 2016. 27(6). VI37

2) Иванов М.В., Мусиенко С.В., Милейко В.А. Оценка «клинического качества» данных секвенирования: стандартизация на пути интеграции NGS в медицижкую генетику. // Конференция "Конференция NGS 2016". Москва. 19 мая 2016 г. С.25.

3) Иванов М.В., Глазова О.В., Мацвай А.Д., Красовский С.А., Амелина Е.Л., Хафизов К.Ф. Применение технологии секвенирования следующего поколения в диагностике муковисцидоза. // Конференция "Конференция NGS 2016". Москва. 19 мая 2016 г. С.31.

4) Иванов М.В., Глазова О.В., Мацвай А.Д., Красовский С.А., Амелина Е.Л., Хафизов К.Ф. Применение технологии секвенирования следующего поколения в диагностике муковисцидоза. // Конференция "NGS в медицинской генетике". Суздаль. 22-24 апреля 2016 г. С. 17.

5) Иванов М.В., Глазова О.В., Мацвай А.Д., Красовский С.А., Амелина Е.Л., Хафизов К.Ф. Оценка «клинического качества» данных секвенирования: стандартизация на пути интеграции NGS в медицижкую генетику. // Конференция "NGS в медицинской генетике". Суздаль. 22-24 апреля 2016 г. С.23.

6) Иванов М.В., Новикова Е.И., Телышева Е.Н., Черненко П.А., Бредер В.В., Лактионов К.К., Баранова А., Милейко В.А. Использование высокопроизводительного секвенирования (NGS) для подбора таргетной терапии при немелкоклеточном раке легкого: преимущества и ограничения. // Конференция "Конференция NGS 2016". Москва. 19 мая 2016 г. С.32.

7) Иванов М.В., Новикова Е.И., Баранова А.В. и др. Опыт использования высокопроизводительного секвенирования (NGS) для подбора таргетной терапии при немелкоклеточном раке легкого: преимущества и ограничения. // Международный ежеквартальный научно-практический журнал по онкологии "Злокачественные опухоли". Москва. 2015. №4. С.310-311.

Глава 1. Обзор литературы Онкологические заболевания. Общие положения.

Рак - заболевание, связанное с возникновением группы клеток, характеризующихся повышенным уровнем пролиферации, способности к инвазии в прилежащие ткани и отдаленному метастазированию. Онкологические заболевания занимают одну из лидирующих позиций в общей структуре смертности [56]. Количество впервые в жизни выявленных онкологических заболеваний растет ежегодно, что обусловлено как развитием технологий скрининга и диагностики злокачественных новообразований, так и увеличением средней продолжительности жизни [6]. Так, "грубый" показатель заболеваемости онкологическими заболеваниями в России в 2017 году составил 420,8 случаев на 100 000 населения, что на 3% выше, чем в 2016 году и на 23% выше, чем в 2007 году.

Рак является гетерогенным заболеванием. В зависимости от первичного очага опухоли, выделяют более 100 видов злокачественных новообразований, происходящих из клеток различного типа. Некоторые типы онкологических заболеваний (например, рак кишечника или груди) классифицируются также на основании молекулярных характеристик опухоли, которые более того могут разниться в зависимости от исследуемой части опухоли или стадии рака.

Несмотря на высокое многообразие злокачественных новообразований, общие принципы лечения схожи для большинства и могут быть классифицированы на оперативное лечение, радиотерапию, лекарственную терапию [7]. Последняя в свою очередь может быть классифицирована на химиотерапию, гормонотерапию, таргетную терапию и иммунотерапию [8-12]. Иногда в рамках ведения онкологического пациента применяется лишь один метод лечения, однако зачастую используется комплекс терапевтических мер. Хирургическое лечение используется для устранения локализованного в доступном для оперативного вмешательства месте новообразования. Совместно с хирургическим лечением, радиотерапия и лекарственная терапия могут использоваться для минимизации риска рецидива заболевания [7,13-15]. В случае метастазирующего заболевания, используются более агрессивные тактики лечения, основанные на радиотерапии и иммунотерапии, которые, однако, зачастую приводят к серьезным побочным эффектам ввиду повреждения здоровых тканей. В соответствии с оценкой, проведенной по результатам клинических исследований усредненный вклад радикальной и адьювантной химиотерапии в пятилетнюю выживаемость составляет не более 3% (разнящийся от 0.7% для рака толстой и прямой кишки до 41.8% для рака яичек) [16]. Столь низкая оценка вклада может быть обусловлена низкой специфичностью химиотерапевтических препаратов -цитотоксические и цитостатические лекарственные препараты общего механизма действия неэффективны для 75% пациентов [17]. Таким образом, это подразумевает необходимость разработки методов подбора терапии в зависимости от определенного спектра персональных факторов пациента и опухоли.

Молекулярные основы канцерогенеза

В соответствии с доминирующим современным представлением о механизме канцерогенеза, несмотря на существенный вклад в процесс развития злокачественных новообразований опухолевого микроокружения, иммунобиологических, эпигенетических и прочих факторов, рак является заболеванием генома [18,19]. И если наследственные генетические варианты обуславливают врожденную предрасположенность, а соматические мутации выступают в роли триггера развития, роста, инвазии и распространения в организме злокачественного новообразования [20-23]. Таким образом, как наследственные генетические варианты, представленные в зародышевой клетке и наследуемые от родителей, так и соматические мутации, случайные изменения в последовательности ДНК единичной клетки (или группы клеток) организма, которые могут быть как спровоцированы воздействием различного рода канцерогенов, так и являться результатом процесса старения или спорадических процессов, играют важную роль в определении дальнейшего сценария развития злокачественного образования [24].

Несмотря на то, что условия и непосредственные механизмы и сценарии зарождения злокачественного новообразования остаются предметом споров, детальные исследования зрелых злокачественных новообразований явно свидетельствуют о процессах клональной эволюции протекающих в опухоли, в рамках которой наибольшее распространение получают наиболее приспособленные к бесконтрольной пролиферации, уходу от иммунологической противоопухолевой защиты и прочим способам развития опухоли [25]. В совокупности с высокой профилиративной активностью опухолевых клеток и характерной для них нестабильности генома, обуславливающей активное накопление соматических изменений генома, результатом клональной эволюции является гетерогенность первичной опухоли и ее метастазов и высокое разнообразие молекулярного профиля в популяции опухолевых клеток. Наблюдаемое высокое разнообразие эволюционных траекторий различный онкологических заболеваний и их результаты, хотя и противоречат Дарвиновской модели эволюции [25-27], свидетельствуют о закреплении в молекулярном профиле опухоли изначальных драйверных мутаций [28], которые передаются вертикально между раковыми клетками. И если спорадические молекулярные изменения, являющиеся побочным продуктом опухолевой эволюции и нестабильности опухолевого генома, которые зачастую не влияют на жизнедеятельность раковой клетки, обнаруживаются лишь в малой доле популяции раковых клеток, драйверные мутации зачастую обнаруживаются во всей популяции и потенциально предопределяют поведение всего злокачественного новообразования.

Предложенная в 2000 году и пересмотренная в 2011 году структуризация отличительных характеристик злокачественных новообразований подразумевает 10 процессов, характерных для жизнедеятельности

раковой клетки: избегание супрессоров роста, поддержка пролиферативного сигнала, дерегуляция клеточного эпигенома, избегание программируемой клеточной смерти, геномная нестабильность и активное накопление спорадических мутаций, ангиогенез, инвазия и метастазирование, избегание иммунологического ответа, избегание клеточного старения и воспалительный процесс [29]. Большинство характеристических черт закрепляются в опухоли благодаря изменениям в последовательности ДНК опухолевых клеток. Например, мутации KRAS, распространенные во многих типах раков, приводят к конститутивной активности сигнального каскада RAS/MAPK, которая приводит к повышенной пролиферации [30], а мутации в гене BRCA1 приводят к нарушению гомологичной рекомбинации и нестабильности генома [31]. Таким образом, молекулярный профиль заболевания, определенный на основании исследования генетических изменений в опухолевых клетках, зачастую предопределяет поведение злокачественного новообразования и может определять эффективные мишени для таргетной лекарственной терапии, блокирующей молекулярные механизмы, характерные для популяции опухолевых клеток конкретного заболевания [32-35].

Прецизионная онкология

Исследования молекулярных особенностей опухолей молочной железы и яичников в 1989 году выявили, что от 15 до 20% опухолей молочной железы характеризуются амплификацией тирозинкиназы семейства рецепторов эпидермального фактора роста EGFR/ErbB, кодируемой прото-онкогеном ERBB2 [36]. Через нижележащие сигнальные каскады, такие как сигнальные пути митоген-активируемых протеинкиназ, ErbB2 регулирует череду важных в жизнедеятельности опухолевых клеток процессов, таких как рост, пролиферация, дифференциация и контроль программируемой клеточной смерти [37,38]. Амплификация гена ERBB2 была ассоциирована с плохим прогнозом лечения рака молочной железы, выявленной на ранней стадии [36]. Серия клинических исследований, результаты которых были опубликованы в 2005 году ознаменовала революцию не только в области лечения рака молочной железы, но и онкологии в целом. Использование рекомбинантного моноклонального антитела направленного против продукта гена ERBB2 при лечении ранних стадий рака молочной железы, характеризующейся амплификацией гена ERBB2 позволило достичь снижения риска рецидива заболевания на 52% и риска смерти на 33% [39,40]. Результаты исследований кардинально изменили сам процесс ведения пациентов, внедрив в него сопутствующую назначению терапевтического средства лабораторную диагностику (или просто - сопутствующую диагностику, от агнл. companion diagnostics), направленную на выявление предиктивного биомаркера.

В отличии от прогностических биомаркеров, которые ассоциированы с увеличением или уменьшением показателей выживаемости вне зависимости от применяемого лечения, предиктивные биомаркеры ассоциированы с чувствительностью или резистентностью к определенной терапии и, соответственно, увеличению или уменьшению показателей выживаемости при применении конкретных схем лечения, в то время как ассоциация с эффективностью прочих схем лечения отсутствует полностью или слабо выражена (Рисунок 1).

А

Б

Время

Время

— Экспериментальная терапия

— Плацебо

Биомаркер-отрицательная группа пациентов Биомаркер-положительная группа пациентов

Рисунок 1. Схематическая иллюстрация примеров негативного (ассоциированного с уменьшением эффективности лечения) прогностического влияния биомаркера на результат лечения (А) и положительного (ассоциированного с чувствительностью к терапии) предиктивного (Б).

На фоне ускоряющегося прогресса в геномных технологиях, увеличивается интерес и к так называемой прецизионной медицине, которая предполагает индивидуализацию терапии на основании молекулярных, средовых и жизненных факторов (в отличии от персонализированной медицины, которая иногда подразумевается, как методология разработки терапии индивидуально для каждого пациента) в том числе в области онкологии [41-45]. В 2015 году 73% онкологических препаратов, находящихся в разработке на стадии клинических исследований, исследовались в рамках парадигмы прецизионной онкологии. В 2018 году среди всех лекарственных средств с новой молекулярной основой одобренных для применения управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США 42% направленны на лечение заболеваний, характеризующихся определенными молекулярными характеристиками (для сравнения, этот же процент в 2014 году составил 21%) [46]. Количество клинических исследований в области онкологии, которые используют методы стратификации пациентов на основании предиктивных биомаркеров возросло с 15% в 2000 году до 55% в 2018, причем более 50% из них исследуют эффективность терапии в зависимости от двух и более биомаркеров, а большинство клинических исследований, не использующих стратификацию на основании предиктивных биомаркеров, направлены на сравнение различных химиотерапевтических схем. Таким образом, с начала тысячелетия в онкологии намечен явный тренд на разработку методов выбора терапии на основании молекулярных характеристик заболевания.

Мета-анализ результатов клинических исследований II фазы опубликованных в 2010-2012 годах продемонстрировал, что повышенный интерес к исследованию предиктивных биомаркеров в разработке новых лекарственных препаратов и разработке сопутствующей оправдан. Среди 570 клинических исследований, проведенных в сумме среди более 32000 пациентов прецизионный подход в сравнении с непрецизионным коррелировал с повышенной медианой частотой ответа (31% против 10.5% соответственно), медианой длительности до прогрессирования заболевания (5.9 против 2.7 месяцев соответственно) и медианой длительности общей выживаемости (13.7 против 8.9 месяцев соответственно). Причем исследования, проводившие стратификацию пациентов на основании генетических биомаркеров, были успешнее (в отношении показателей медианы длительности до прогрессирования и медианы длительности общей выживаемости) в сравнении с исследованиями, проводившими стратификацию на основании белковых биомаркеров. Более того, помимо повышенной

эффективности лечения, персонализированный подход также был ассоциирован с уменьшением смертности непосредственно от лечения (медиана 1.5% против 2.3%) [47]. Повышенная эффективность прецизионного подхода также была подтверждена по результатам клинических исследований I фазы (2011-2013 годы) [48] и клинических исследований, результаты которых использовались для одобрения препаратов управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США [49]. В совокупности результаты этих исследований свидетельствуют о необходимости дальнейшей разработки методов стратификации пациентов и определении потенциальной эффективности в зависимости от генетических биомаркеров, а также, учитывая высокую частоту таргетируемых молекулярно-генетических нарушений среди некоторых нозологий (Рисунок 2), и высокой перспективности этого подхода в современной онкологии.

Мела нома 73%

Рад щитовидной железы 56%

Рак толстой и прямой кишки 51%

Рак эндометрия 43%

Рад поджелудочной железы 41%

Рак легкого 41%

Рак молочной железы 32%

Прочие гинекологические опухоли 31%

Уриногенитальные опухоли 29%

Прочие опухоли ЖКТ 25%

Рак головы и шеи 21%

Рэкяичника 21%

Рисунок 2. Доля пациентов, опухоли которых характеризуются драйверными изменениями, которые могут быть таргетированы специфическими лекарственными препаратами, по нозологиям (адаптировано из Jardim et al. [49])

Достижения в области прецизионной онкологии уже сейчас реструктурировали принципы ведения онкологических пациентов. Лекарственная терапия метастатических заболеваний многих типов уже в первой линии предполагает предшествующую молекулярно-генетическую диагностику [4,50-53]. Для большинства пациентов процесс лечения уже сейчас начинается с исследования молекулярных характеристик заболевания. Внедрение прецизионных методов онкологии, основанных на персонализации лекарственной терапии в зависимости от обнаруженных предиктивных биомаркеров осуществляется в рамках доказательной медицины [54]. Таким образом, стратификация на основании обнаруженных биомаркеров в рамках рутинного ведения пациентов осуществляется только если эффективность (или неэффективность) терапии в зависимости от биомаркера продемонстрирована в рамках клинических исследований. В случае же, если обнаруживается ранее не описанный вариант, его функциональная значимость (как для повреждающих вариантов в генах опухолевой супрессии, так и для активирующих вариантов в онкогенах) и связь с клиническим биомаркером (соответствующая ассоциация с эффективностью или неэффективностью терапии) не может быть достоверно установлено, а подобного рода de novo вариант не может использоваться в дальнейшей клинической практике за пределами клинических исследований (за редким исключением достоверно инактивирующих вариантов в генах опухолевой супрессии). В соответствии с этим спектр клинически-значимых генетических вариантов (включая однонуклеотидные варианты и небольшие вставки/делеции) ограничен (в первую очередь доказательной базой, определяемой исходя из опубликованных результатов клинических

исследований, инструкций к препаратам и литературным данным прочего рода) и заранее предопределен (к определенному моменту тестирования и последующей клинической интерпретации результатов).

Роль высокопроизводительного секвенирования в молекулярной онкодиагностике

В соответствии с управлением по контролю качества пищевых продуктов и лекарственных препаратов США (от англ. Food and Drug Administration - FDA) 32 из 34 (94%) всех зарегистрированных для применения в клинической практике перед назначением терапевтического лечения онкологического заболевания биомаркеров могут быть детектированы в том числе молекулярно-генетическими методами лабораторной диагностики, а для детектирования 27 из 34 (79%) необходимо непосредственное определение последовательности протяженных регионов ДНК или заранее определенных геномных позиций (Таблица 1). Таким образом, геномные биомаркеры являются преобладающими по сравнению с белковыми (измерение экспрессии, обычно измеряющейся с помощью иммуногистохимического метода исследования (ИГХ)) и транскриптомными (либо детектирование изменения копийности отдельных регионов генома, либо детектирования крупных геномных перестроек, обычно выполняющимися методом флуоресцентной гибридизации in situ (от англ. fluorescence in situ hybridization - FISH)). Наиболее распространенными методами определения геномных биомаркеров могут быть: прямое секвенирование по Сэнгеру, ПЦР и высокопроизводительное секвенирование. Прямое секвенирование по Сэнгеру помимо низкой чувствительности в отношении детектируемой частоты вариантного аллеля [55], редко позволяет достигать требуемой производительности из-за низких возможностей масштабирования. ПЦР не позволяет определять протяженные нуклеотидные последовательности [56] и, если для тех геномных биомаркеров, которые подразумевают детектирование отдельных генетических вариантов (например, соматические мутации EGFR или KRAS) технология является доминирующей на рынке сопутствующей технологии ввиду простоты, высокой производительности и низкой стоимости исследования, то для некоторых геномных биомаркеров эта технология просто неприменима (например, генетические варианты соматической или наследственной природы в генах BRCA1 или BRCA2).

Похожие диссертационные работы по специальности «Математическая биология, биоинформатика», 03.01.09 шифр ВАК

Список литературы диссертационного исследования кандидат наук Иванов Максим Вячеславович, 2020 год

Список литературы

1. Pereira R, Oliveira J, Sousa M. Bioinformatics and Computational Tools for Next-Generation Sequencing Analysis in Clinical Genetics. J Clin Med. 2020 Jan 3;9(1):132. doi: 10.3390/jcm9010132. PMID: 31947757; PMCID: PMC7019349.

2. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. Nature. 2004 Oct 21;431(7011):931-45. doi: 10.1038/nature03001. PMID: 15496913.

3. Castéra L, Krieger S, Rousselin A et al. Next-generation sequencing for the diagnosis of hereditary breast and ovarian cancer using genomic capture targeting multiple candidate

genes. Eur J Hum Genet. 2014 Nov;22(11):1305-13. doi: 10.1038/ejhg.2014.16. Epub 2014 Feb 19. PMID: 24549055; PMCID: PMC4200427.

4. Mosele F, Remon J, Mateo J et al. Recommendations for the use of next-generation sequencing (NGS) for patients with metastatic cancers: a report from the ESMO Precision Medicine Working Group. Ann Oncol. 2020 Aug 24:S0923-7534(20)39971-3. doi: 10.1016/j.annonc.2020.07.014. Epub ahead of print. PMID: 32853681.

5. Miller KD, Nogueira L, Mariotto AB et al. Cancer treatment and survivorship statistics, 2019. CA Cancer J Clin. 2019 Sep;69(5):363-385. doi: 10.3322/caac.21565. Epub 2019 Jun 11. PMID: 31184787.

6. Каприн А.Д., Старинский В.В., Петрова Г.В. Злокачественные новообразования в России в 2018 году (заболеваемость и смертность) //

7. Urruticoechea A, Alemany R, Balart J, Villanueva A, Vinals F, Capella G. Recent advances in cancer therapy: an overview. Curr Pharm Des. 2010 Jan;16(1):3-10. doi: 10.2174/138161210789941847. PMID: 20214614.

8. Shroff GS, de Groot PM, Papadimitrakopoulou VA, Truong MT, Carter BW. Targeted Therapy and Immunotherapy in the Treatment of Non-Small Cell Lung Cancer. Radiol Clin North Am. 2018 May;56(3):485-495. doi: 10.1016/j.rcl.2018.01.012. PMID: 29622080.

9. Nagasaka M, Gadgeel SM. Role of chemotherapy and targeted therapy in early-stage non-small cell lung cancer. Expert Rev Anticancer Ther. 2018 Jan;18(1):63-70. doi: 10.1080/14737140.2018.1409624. Epub 2017 Nov 26. PMID: 29168933; PMCID: PMC6863145.

10. Olszanski AJ. Current and future roles of targeted therapy and immunotherapy in advanced melanoma. J Manag Care Spec Pharm. 2014 Apr;20(4):346-56. doi: 10.18553/jmcp.2014.20.4.346. PMID: 24684639.

11. Nicolini A, Carpi A, Ferrari P, Biava PM, Rossi G. Immunotherapy and Hormone-therapy in Metastatic Breast Cancer: A Review and an Update. Curr Drug Targets. 2016;17(10):1127-39. doi: 10.2174/1389450117666160201114752. PMID: 26844558.

12. Esteva FJ, Hubbard-Lucey VM, Tang J, Pusztai L. Immunotherapy and targeted therapy combinations in metastatic breast cancer. Lancet Oncol. 2019 Mar;20(3):e175-e186. doi: 10.1016/S1470-2045(19)30026-9. PMID: 30842061.

13. Jaffray DA, Gospodarowicz MK. Radiation Therapy for Cancer. In: Gelband H, Jha P, Sankaranarayanan R, Horton S, editors. Cancer: Disease Control Priorities, Third Edition (Volume 3). Washington (DC): The International Bank for Reconstruction and Development / The World Bank; 2015 Nov 1. Chapter 14. PMID: 26913334.

14. Maas KW, El Sharouni SY, Smit EF, Schramel FM. Sequencing chemotherapy, radiotherapy and surgery in combined modality treatment of stage III nonsmall cell lung cancer. Curr Opin Pulm Med. 2007 Jul;13(4):297-304. doi: 10.1097/MCP.0b013e32819f834a. PMID: 17534176.

15. Recht A, Come SE, Henderson IC, Gelman RS, Silver B, Hayes DF, Shulman LN, Harris JR. The sequencing of chemotherapy and radiation therapy after conservative surgery for early-stage breast cancer. N Engl J Med. 1996 May 23;334(21):1356-61. doi: 10.1056/NEJM199605233342102. PMID: 8614420.

16. Morgan G, Ward R, Barton M. The contribution of cytotoxic chemotherapy to 5-year survival in adult malignancies. Clin Oncol (R Coll Radiol). 2004 Dec;16(8):549-60. doi: 10.1016/j.clon.2004.06.007. PMID: 15630849.

17. Spear BB, Heath-Chiozzi M, Huff J. Clinical application of pharmacogenetics. Trends Mol Med. 2001 May;7(5):201-4. doi: 10.1016/s1471-4914(01)01986-4. PMID: 11325631.

18. Vineis P, Schatzkin A, Potter JD. Models of carcinogenesis: an overview. Carcinogenesis. 2010 Oct;31(10):1703-9. doi: 10.1093/carcin/bgq087. Epub 2010 Apr 29. PMID: 20430846; PMCID: PMC3025741.

19. Pandya PH, Murray ME, Pollok KE, Renbarger JL. The Immune System in Cancer Pathogenesis: Potential Therapeutic Approaches. J Immunol Res. 2016;2016:4273943. doi: 10.1155/2016/4273943. Epub 2016 Dec 26. PMID: 28116316; PMCID: PMC5220497.

20. MacPherson D, Dyer MA. Retinoblastoma: from the two-hit hypothesis to targeted chemotherapy. Cancer Res. 2007 Aug 15;67(16):7547-50. doi: 10.1158/0008-5472.CAN-07-0276. PMID: 17699756.

21. Pan S, Dong Q, Sun LS, Li TJ. Mechanisms of inactivation of PTCH1 gene in nevoid basal cell carcinoma syndrome: modification of the two-hit hypothesis. Clin Cancer Res. 2010 Jan 15;16(2):442-50. doi: 10.1158/1078-0432.CCR-09-2574. Epub 2010 Jan 12. PMID: 20068110.

22. Ryland GL, Doyle MA, Goode D, Boyle SE, Choong DY, Rowley SM, Li J; Australian Ovarian Cancer Study Group, Bowtell DD, Tothill RW, Campbell IG, Gorringe KL. Loss of heterozygosity: what is it good for? BMC Med Genomics. 2015 Aug 1;8:45. doi: 10.1186/s12920-015-0123-z. PMID: 26231170; PMCID: PMC4522148.

23. Haeno H, Iwasa Y, Michor F. The evolution of two mutations during clonal expansion. Genetics. 2007 Dec;177(4):2209-21. doi: 10.1534/genetics.107.078915. PMID: 18073428; PMCID: PMC2219486.

24. Mardis ER. Genome sequencing and cancer. Curr Opin Genet Dev. 2012 Jun;22(3):245-50. doi: 10.1016/j.gde.2012.03.005. Epub 2012 Apr 23. PMID: 22534183; PMCID: PMC3890425.

25. Ling S, Hu Z, Yang Z, Yang F, Li Y, Lin P, Chen K, Dong L, Cao L, Tao Y, Hao L, Chen Q, Gong Q, Wu D, Li W, Zhao W, Tian X, Hao C, Hungate EA, Catenacci DV, Hudson RR, Li WH, Lu X, Wu CI. Extremely high genetic diversity in a single tumor points to prevalence of non-Darwinian cell evolution. Proc Natl Acad Sci U S A. 2015 Nov 24;112(47):E6496-505. doi: 10.1073/pnas.1519556112. Epub 2015 Nov 11. Erratum in: Proc Natl Acad Sci U S A. 2016 Feb 2;113(5):E663. PMID: 26561581; PMCID: PMC4664355.

26. Rubanova Y, Shi R, Harrigan CF, Li R, Wintersinger J, Sahin N, Deshwar A; PCAWG Evolution and Heterogeneity Working Group, Morris Q; PCAWG Consortium. Reconstructing evolutionary trajectories of mutation signature activities in cancer using TrackSig. Nat Commun. 2020 Feb 5;11(1):731. doi: 10.1038/s41467-020-14352-7. PMID: 32024834; PMCID: PMC7002414.

27. Molina-Peña R, Álvarez MM. A simple mathematical model based on the cancer stem cell hypothesis suggests kinetic commonalities in solid tumor growth. PLoS One. 2012;7(2):e26233. doi: 10.1371/journal.pone.0026233. Epub 2012 Feb 17. PMID: 22363395; PMCID: PMC3281810.

28. Priestley P, Baber J, Lolkema MP, Steeghs N, de Bruijn E, Shale C, Duyvesteyn K, Haidari S, van Hoeck A, Onstenk W, Roepman P, Voda M, Bloemendal HJ, Tjan-Heijnen VCG, van Herpen CML, Labots M, Witteveen PO, Smit EF, Sleijfer S, Voest EE, Cuppen E. Pan-cancer whole-genome analyses of metastatic solid tumours. Nature. 2019 Nov;575(7781):210-216. doi: 10.1038/s41586-019-1689-y. Epub 2019 Oct 23. PMID: 31645765; PMCID: PMC6872491.

29. Hanahan D, Weinberg RA. Hallmarks of cancer: the next generation. Cell. 2011 Mar 4;144(5):646-74. doi: 10.1016/j.cell.2011.02.013. PMID: 21376230.

30. Jancík S, Drábek J, Radzioch D, Hajdúch M. Clinical relevance of KRAS in human cancers. J Biomed Biotechnol. 2010;2010:150960. doi: 10.1155/2010/150960. Epub 2010 Jun 7. PMID: 20617134; PMCID: PMC2896632.

31. Mehrgou A, Akouchekian M. The importance of BRCA1 and BRCA2 genes mutations in breast cancer development. Med J Islam Repub Iran. 2016 May 15;30:369. PMID: 27493913; PMCID: PMC4972064.

32. Pon JR, Marra MA. Driver and passenger mutations in cancer. Annu Rev Pathol. 2015;10:25-50. doi: 10.1146/annurev-pathol-012414-040312. Epub 2014 Oct 17. PMID: 25340638.

33. Heppner DE, Beyett TS, Eck MJ. A driving test for oncogenic mutations. J Biol Chem. 2019 Jun 14;294(24):9390-9391. doi: 10.1074/jbc.H119.009452. PMID: 31201242; PMCID: PMC6579455.

34. Reddy BY, Miller DM, Tsao H. Somatic driver mutations in melanoma. Cancer. 2017 Jun 1;123(S11):2104-2117. doi: 10.1002/cncr.30593. PMID: 28543693.

35. Zhang LL, Kan M, Zhang MM, Yu SS, Xie HJ, Gu ZH, Wang HN, Zhao SX, Zhou GB, Song HD, Zheng CX. Multiregion sequencing reveals the intratumor heterogeneity of driver mutations in TP53-driven non-small cell lung cancer. Int J Cancer. 2017 Jan 1;140(1):103-108. doi: 10.1002/ijc.30437. Epub 2016 Oct 3. PMID: 27646734.

36. Slamon DJ, Godolphin W, Jones LA, Holt JA, Wong SG, Keith DE, Levin WJ, Stuart SG, Udove J, Ullrich A, et al. Studies of the HER-2/neu proto-oncogene in human breast and ovarian cancer. Science. 1989 May 12;244(4905):707-12. doi: 10.1126/science.2470152. PMID: 2470152.

37. Plowman GD, Green JM, Culouscou JM, Carlton GW, Rothwell VM, Buckley S. Heregulin induces tyrosine phosphorylation of HER4/p180erbB4. Nature. 1993 Dec 2;366(6454):473-5. doi: 10.1038/366473a0. PMID: 7902537.

38. English DP, Roque DM, Santin AD. HER2 expression beyond breast cancer: therapeutic implications for gynecologic malignancies. Mol Diagn Ther. 2013 Apr;17(2):85-99. doi: 10.1007/s40291-013-0024-9. PMID: 23529353; PMCID: PMC3660991.

39. Piccart-Gebhart MJ, Procter M, Leyland-Jones B, Goldhirsch A, Untch M, Smith I, Gianni L, Baselga J, Bell R, Jackisch C, Cameron D, Dowsett M, Barrios CH, Steger G, Huang CS, Andersson M, Inbar M, Lichinitser M, Lang I, Nitz U, Iwata H, Thomssen C, Lohrisch C, Suter TM, Rüschoff J, Suto T, Greatorex V, Ward C, Straehle C, McFadden E, Dolci MS, Gelber RD; Herceptin Adjuvant (HERA) Trial Study Team. Trastuzumab after adjuvant chemotherapy in HER2-positive breast cancer. N Engl J Med. 2005 Oct 20;353(16):1659-72. doi: 10.1056/NEJMoa052306. PMID: 16236737.

40. Romond EH, Perez EA, Bryant J, Suman VJ, Geyer CE Jr, Davidson NE, Tan-Chiu E, Martino S, Paik S, Kaufman PA, Swain SM, Pisansky TM, Fehrenbacher L, Kutteh LA, Vogel VG, Visscher DW, Yothers G, Jenkins RB, Brown AM, Dakhil SR, Mamounas EP, Lingle WL, Klein PM, Ingle JN, Wolmark N. Trastuzumab plus adjuvant chemotherapy for operable HER2-positive breast cancer. N Engl J Med. 2005 Oct 20;353(16):1673-84. doi: 10.1056/NEJMoa052122. PMID: 16236738.

41. Kumar-Sinha C, Chinnaiyan AM. Precision oncology in the age of integrative genomics. Nat Biotechnol. 2018 Jan 10;36(1):46-60. doi: 10.1038/nbt.4017. PMID: 29319699; PMCID: PMC6364676.

42. Abrams J, Conley B, Mooney M, Zwiebel J, Chen A, Welch JJ, Takebe N, Malik S, McShane L, Korn E, Williams M, Staudt L, Doroshow J. National Cancer Institute's Precision Medicine Initiatives for the new National Clinical Trials Network. Am Soc Clin Oncol Educ Book. 2014:716. doi: 10.14694/EdBook_AM.2014.34.71. PMID: 24857062.

43. Collins FS, Varmus H. A new initiative on precision medicine. N Engl J Med. 2015 Feb 26;372(9):793-5. doi: 10.1056/NEJMp1500523. Epub 2015 Jan 30. PMID: 25635347; PMCID: PMC5101938.

44. Ashley EA. The precision medicine initiative: a new national effort. JAMA. 2015 Jun 2;313(21):2119-20. doi: 10.1001/jama.2015.3595. PMID: 25928209.

45. Ashley EA. Towards precision medicine. Nat Rev Genet. 2016 Aug 16;17(9):507-22. doi: 10.1038/nrg.2016.86. PMID: 27528417.

46. Pritchard, D., Wells, C. "Raising the Bar: FDA Accelerates the Push Toward Personalized Medicine. J. Precision Medicine, 5;2, pp. 36-39.

47. Schwaederle M, Zhao M, Lee JJ, Eggermont AM, Schilsky RL, Mendelsohn J, Lazar V, Kurzrock R. Impact of Precision Medicine in Diverse Cancers: A Meta-Analysis of Phase II Clinical Trials. J Clin Oncol. 2015 Nov 10;33(32):3817-25. doi: 10.1200/JC0.2015.61.5997. Epub 2015 Aug 24. PMID: 26304871; PMCID: PMC4737863.

48. Schwaederle M, Zhao M, Lee JJ, Lazar V, Leyland-Jones B, Schilsky RL, Mendelsohn J, Kurzrock R. Association of Biomarker-Based Treatment Strategies With Response Rates and Progression-Free Survival in Refractory Malignant Neoplasms: A Meta-analysis. JAMA Oncol. 2016 Nov 1;2(11):1452-1459. doi: 10.1001/jamaoncol.2016.2129. PMID: 27273579.

49. Jardim DL, Schwaederle M, Wei C, Lee JJ, Hong DS, Eggermont AM, Schilsky RL, Mendelsohn J, Lazar V, Kurzrock R. Impact of a Biomarker-Based Strategy on Oncology Drug Development: A Meta-analysis of Clinical Trials Leading to FDA Approval. J Natl Cancer Inst. 2015 Sep 15;107(11):djv253. doi: 10.1093/jnci/djv253. Erratum in: J Natl Cancer Inst. 2016 Feb;108(2). pii: djv423. doi: 10.1093/jnci/djv423. PMID: 26378224; PMCID: PMC4857149.

50. Kalemkerian GP, Narula N, Kennedy EB, Biermann WA, Donington J, Leighl NB, Lew M, Pantelas J, Ramalingam SS, Reck M, Saqi A, Simoff M, Singh N, Sundaram B. Molecular Testing Guideline for the Selection of Patients With Lung Cancer for Treatment With Targeted Tyrosine Kinase Inhibitors: American Society of Clinical Oncology Endorsement of the College of American Pathologists/International Association for the Study of Lung Cancer/Association for Molecular Pathology Clinical Practice Guideline Update. J Clin Oncol. 2018 Mar 20;36(9):911-919. doi: 10.1200/JCO.2017.76.7293. Epub 2018 Feb 5. PMID: 29401004.

51. Franzese E, Centonze S, Diana A, Carlino F, Guerrera LP, Di Napoli M, De Vita F, Pignata S, Ciardiello F, Orditura M. PARP inhibitors in ovarian cancer. Cancer Treat Rev. 2019 Feb;73:1-9. doi: 10.1016/j.ctrv.2018.12.002. Epub 2018 Dec 4. PMID: 30543930.

52. Terheyden P, Krackhardt A, Eigentler T. The Systemic Treatment of Melanoma. Dtsch Arztebl Int. 2019 Jul 22;116(29-30):497-504. doi: 10.3238/arztebl.2019.0497. PMID: 31452501; PMCID: PMC6726851.

53. Sepulveda AR, Hamilton SR, Allegra CJ, Grody W, Cushman-Vokoun AM, Funkhouser WK, Kopetz SE, Lieu C, Lindor NM, Minsky BD, Monzon FA, Sargent DJ, Singh VM, Willis J, Clark J, Colasacco C, Rumble RB, Temple-Smolkin R, Ventura CB, Nowak JA. Molecular Biomarkers for the Evaluation of Colorectal Cancer: Guideline Summary From the American Society for Clinical Pathology, College of American Pathologists, Association for Molecular Pathology, and American Society of Clinical Oncology. J Oncol Pract. 2017 May;13(5):333-337. doi: 10.1200/JOP.2017.022152. Epub 2017 Mar 28. PMID: 28350513.

54. Tannock IF, Amir E, Booth CM, Niraula S, Ocana A, Seruga B, Templeton AJ, Vera-Badillo F. Relevance of randomised controlled trials in oncology. Lancet Oncol. 2016 Dec;17(12):e560-e567. doi: 10.1016/S1470-2045(16)30572-1. PMID: 27924754.

55. Meldrum C, Doyle MA, Tothill RW. Next-generation sequencing for cancer diagnostics: a practical perspective. Clin Biochem Rev. 2011 Nov;32(4):177-95. PMID: 22147957; PMCID: PMC3219767.

56. Cummings CA, Peters E, Lacroix L, Andre F, Lackner MR. The Role of Next-Generation Sequencing in Enabling Personalized Oncology Therapy. Clin Transl Sci. 2016 Dec;9(6):283-292. doi: 10.1111/cts.12429. Epub 2016 Nov 15. PMID: 27860319; PMCID: PMC5351002.

57. Matthijs G, Souche E, Alders M, Corveleyn A, Eck S, Feenstra I, Race V, Sistermans E, Sturm M, Weiss M, Yntema H, Bakker E, Scheffer H, Bauer P; EuroGentest; European Society of Human Genetics. Guidelines for diagnostic next-generation sequencing. Eur J Hum Genet. 2016 Jan;24(1):2-5. doi: 10.1038/ejhg.2015.226. Epub 2015 Oct 28. Erratum in: Eur J Hum Genet. 2016 0ct;24(10):1515. PMID: 26508566; PMCID: PMC4795226.

58. Roy S, Coldren C, Karunamurthy A, Kip NS, Klee EW, Lincoln SE, Leon A, Pullambhatla M, Temple-Smolkin RL, Voelkerding KV, Wang C, Carter AB. Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists. J Mol Diagn. 2018 Jan;20(1):4-27. doi: 10.1016/j.jmoldx.2017.11.003. Epub 2017 Nov 21. PMID: 29154853.

59. Gao Y, Xi H, Wei B, Cui J, Zhang K, Li H, Cai A, Shen W, Li J, Rosell R, Chao J, Chen T, Klempner S, Qiao Z, Chen L. Association Between Liquid Biopsy and Prognosis of Gastric Cancer Patients: A Systematic Review and Meta-Analysis. Front Oncol. 2019 Nov 26;9:1222. doi: 10.3389/fonc.2019.01222. PMID: 31850190; PMCID: PMC6901923.

60. Diaz LA Jr, Bardelli A. Liquid biopsies: genotyping circulating tumor DNA. J Clin Oncol. 2014 Feb 20;32(6):579-86. doi: 10.1200/JCO.2012.45.2011. Epub 2014 Jan 21. PMID: 24449238; PMCID: PMC4820760.

61. Lin CC, Huang WL, Wei F, Su WC, Wong DT. Emerging platforms using liquid biopsy to detect EGFR mutations in lung cancer. Expert Rev Mol Diagn. 2015;15(11):1427-40. doi: 10.1586/14737159.2015.1094379. Epub 2015 Sep 30. PMID: 26420338; PMCID: PMC4889428.

62. Lin J, Kennedy SH, Svarovsky T, Rogers J, Kemnitz JW, Xu A, Zondervan KT. High-quality genomic DNA extraction from formalin-fixed and paraffin-embedded samples deparaffinized using mineral oil. Anal Biochem. 2009 Dec 15;395(2):265-7. doi: 10.1016/j.ab.2009.08.016. Epub 2009 Aug 19. PMID: 19698695; PMCID: PMC2764035.

63. Craig JM, Vena N, Ramkissoon S, Idbaih A, Fouse SD, Ozek M, Sav A, Hill DA, Margraf LR, Eberhart CG, Kieran MW, Norden AD, Wen PY, Loda M, Santagata S, Ligon KL, Ligon AH. DNA fragmentation simulation method (FSM) and fragment size matching improve aCGH performance of FFPE tissues. PLoS One. 2012;7(6):e38881. doi: 10.1371/journal.pone.0038881. Epub 2012 Jun 15. PMID: 22719973; PMCID: PMC3376148.

64. McDonough SJ, Bhagwate A, Sun Z, Wang C, Zschunke M, Gorman JA, Kopp KJ, Cunningham JM. Use of FFPE-derived DNA in next generation sequencing: DNA extraction methods. PLoS One. 2019 Apr 11;14(4):e0211400. doi: 10.1371/journal.pone.0211400. PMID: 30973937; PMCID: PMC6459541.

65. Standage DS, Brown CT, Hormozdiari F. Kevlar: A Mapping-Free Framework for Accurate Discovery of De Novo Variants. iScience. 2019 Aug 30;18:28-36. doi: 10.1016/j.isci.2019.07.032. Epub 2019 Jul 23. PMID: 31377530; PMCID: PMC6682328.

66. Pajuste FD, Kaplinski L, Möls M, Puurand T, Lepamets M, Remm M. FastGT: an alignment-free method for calling common SNVs directly from raw sequencing reads. Sci Rep. 2017 May 31;7(1):2537. doi: 10.1038/s41598-017-02487-5. PMID: 28566690; PMCID: PMC5451431.

67. Audano PA, Ravishankar S, Vannberg FO. Mapping-free variant calling using haplotype reconstruction from k-mer frequencies. Bioinformatics. 2018 May 15;34(10):1659-1665. doi: 10.1093/bioinformatics/btx753. PMID: 29186321; PMCID: PMC5946877.

68. Chen S, Zhou Y, Chen Y, Gu J. fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 2018 Sep 1;34(17):i884-i890. doi: 10.1093/bioinformatics/bty560. PMID: 30423086; PMCID: PMC6129281.

69. Chen S, Huang T, Zhou Y, Han Y, Xu M, Gu J. AfterQC: automatic filtering, trimming, error removing and quality control for fastq data. BMC Bioinformatics. 2017 Mar 14;18(Suppl 3):80. doi: 10.1186/s12859-017-1469-3. PMID: 28361673; PMCID: PMC5374548.

70. Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 2009 Jul 15;25(14):1754-60. doi: 10.1093/bioinformatics/btp324. Epub 2009 May 18. PMID: 19451168; PMCID: PMC2705234.

71. Langmead B. Aligning short sequencing reads with Bowtie. Curr Protoc Bioinformatics. 2010 Dec;Chapter 11:Unit 11.7. doi: 10.1002/0471250953.bi1107s32. PMID: 21154709; PMCID: PMC3010897.

72. Ebbert MT, Wadsworth ME, Staley LA, Hoyt KL, Pickett B, Miller J, Duce J; Alzheimer's Disease Neuroimaging Initiative, Kauwe JS, Ridge PG. Evaluating the necessity of PCR duplicate removal from next-generation sequencing data and a comparison of approaches. BMC Bioinformatics. 2016 Jul 25;17 Suppl 7(Suppl 7):239. doi: 10.1186/s12859-016-1097-3. PMID: 27454357; PMCID: PMC4965708.

73. Schubert M, Lindgreen S, Orlando L. AdapterRemoval v2: rapid adapter trimming, identification, and read merging. BMC Res Notes. 2016 Feb 12;9:88. doi: 10.1186/s13104-016-1900-2. PMID: 26868221; PMCID: PMC4751634.

74. Mose LE, Perou CM, Parker JS. Improved indel detection in DNA and RNA via realignment with ABRA2. Bioinformatics. 2019 Sep 1;35(17):2966-2973. doi: 10.1093/bioinformatics/btz033. PMID: 30649250; PMCID: PMC6735753.

75. Shivram H, Iyer VR. Identification and removal of sequencing artifacts produced by mispriming during reverse transcription in multiple RNA-seq technologies. RNA. 2018 Sep;24(9):1266-1274. doi: 10.1261/rna.066217.118. Epub 2018 Jun 27. PMID: 29950518; PMCID: PMC6097653.

76. Costello M, Pugh TJ, Fennell TJ, Stewart C, Lichtenstein L, Meldrim JC, Fostel JL, Friedrich DC, Perrin D, Dionne D, Kim S, Gabriel SB, Lander ES, Fisher S, Getz G. Discovery and characterization of artifactual mutations in deep coverage targeted capture sequencing data due to oxidative DNA damage during sample preparation. Nucleic Acids Res. 2013 Apr 1;41(6):e67. doi: 10.1093/nar/gks1443. Epub 2013 Jan 8. PMID: 23303777; PMCID: PMC3616734.

77. Lanman RB, Mortimer SA, Zill OA, Sebisanovic D, Lopez R, Blau S, Collisson EA, Divers SG, Hoon DS, Kopetz ES, Lee J, Nikolinakos PG, Baca AM, Kermani BG, Eltoukhy H, Talasaz A. Analytical and Clinical Validation of a Digital Sequencing Panel for Quantitative, Highly Accurate Evaluation of Cell-Free Circulating Tumor DNA. PLoS One. 2015 Oct 16;10(10):e0140712. doi: 10.1371/journal.pone.0140712. PMID: 26474073; PMCID: PMC4608804.

78. DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, Philippakis AA, del Angel G, Rivas MA, Hanna M, McKenna A, Fennell TJ, Kernytsky AM, Sivachenko AY, Cibulskis K, Gabriel SB, Altshuler D, Daly MJ. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat Genet. 2011 May;43(5):491-8. doi: 10.1038/ng.806. Epub 2011 Apr 10. PMID: 21478889; PMCID: PMC3083463.

79. Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. doi: 10.1093/bioinformatics/btr509. Epub 2011 Sep 8. PMID: 21903627; PMCID: PMC3198575.

80. Koboldt DC, Zhang Q, Larson DE, Shen D, McLellan MD, Lin L, Miller CA, Mardis ER, Ding L, Wilson RK. VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res. 2012 Mar;22(3):568-76. doi: 10.1101/gr.129684.111. Epub 2012 Feb 2. PMID: 22300766; PMCID: PMC3290792.

81. Xu F, Wang W, Wang P, Jun Li M, Chung Sham P, Wang J. A fast and accurate SNP detection algorithm for next-generation sequencing data. Nat Commun. 2012;3:1258. doi: 10.1038/ncomms2256. PMID: 23212387.

82. Ding J, McConechy MK, Horlings HM, Ha G, Chun Chan F, Funnell T, Mullaly SC, Reimand J, Bashashati A, Bader GD, Huntsman D, Aparicio S, Condon A, Shah SP. Systematic analysis of somatic mutations impacting gene expression in 12 tumour types. Nat Commun. 2015 Oct 5;6:8554. doi: 10.1038/ncomms9554. PMID: 26436532; PMCID: PMC4600750.

83. Lin W, Lin HD, Guo XY, Lin Y, Su FX, Jia WH, Tang LY, Zheng W, Long JR, Ren ZF. Allelic expression imbalance polymorphisms in susceptibility chromosome regions and the risk and survival of breast cancer. Mol Carcinog. 2017 Jan;56(1):300-311. doi: 10.1002/mc.22493. Epub 2016 Apr 29. PMID: 27128794.

84. Rhee JK, Lee S, Park WY, Kim YH, Kim TM. Allelic imbalance of somatic mutations in cancer genomes and transcriptomes. Sci Rep. 2017 May 10;7(1):1653. doi: 10.1038/s41598-017-01966-z. PMID: 28490743; PMCID: PMC5431982.

85. Prado K, Zhang KX, Pellegrini M, Chin AI. Sequencing of cancer cell subpopulations identifies micrometastases in a bladder cancer patient. Oncotarget. 2017 Jul 11;8(28):45619-45625. doi: 10.18632/oncotarget.17312. PMID: 28487492; PMCID: PMC5542213.

86. Taylor-Weiner A, Stewart C, Giordano T, Miller M, Rosenberg M, Macbeth A, Lennon N, Rheinbay E, Landau DA, Wu CJ, Getz G. DeTiN: overcoming tumor-in-normal contamination. Nat Methods. 2018 Jul;15(7):531-534. doi: 10.1038/s41592-018-0036-9. Epub 2018 Jun 25. PMID: 29941871; PMCID: PMC6528031.

87. Aran D, Camarda R, Odegaard J, Paik H, Oskotsky B, Krings G, Goga A, Sirota M, Butte AJ. Comprehensive analysis of normal adjacent to tumor transcriptomes. Nat Commun. 2017 Oct 20;8(1):1077. doi: 10.1038/s41467-017-01027-z. PMID: 29057876; PMCID: PMC5651823.

88. Simonetti G, Bruno S, Padella A, Tenti E, Martinelli G. Aneuploidy: Cancer strength or vulnerability? Int J Cancer. 2019 Jan 1;144(1):8-25. doi: 10.1002/ijc.31718. Epub 2018 Oct 31. PMID: 29981145; PMCID: PMC6587540.

89. Sansregret L, Swanton C. The Role of Aneuploidy in Cancer Evolution. Cold Spring Harb Perspect Med. 2017 Jan 3;7(1):a028373. doi: 10.1101/cshperspect.a028373. PMID: 28049655; PMCID: PMC5204330.

90. Jia Y, Chen L, Jia Q, Dou X, Xu N, Liao DJ. The well-accepted notion that gene amplification contributes to increased expression still remains, after all these years, a reasonable but unproven assumption. J Carcinog. 2016 May 20;15:3. doi: 10.4103/1477-3163.182809. PMID: 27298590; PMCID: PMC4895059.

91. Bagci O, Kurtgöz S. Amplification of Cellular Oncogenes in Solid Tumors. N Am J Med Sci. 2015 Aug;7(8):341-6. doi: 10.4103/1947-2714.163641. PMID: 26417556; PMCID: PMC4561439.

92. Deshpande V, Luebeck J, Nguyen ND, Bakhtiari M, Turner KM, Schwab R, Carter H, Mischel PS, Bafna V. Exploring the landscape of focal amplifications in cancer using AmpliconArchitect. Nat Commun. 2019 Jan 23;10(1):392. doi: 10.1038/s41467-018-08200-y. PMID: 30674876; PMCID: PMC6344493.

93. Spurr L, Li M, Alomran N, Zhang Q, Restrepo P, Movassagh M, Trenkov C, Tunnessen N, Apanasovich T, Crandall KA, Edwards N, Horvath A. Systematic pan-cancer analysis of somatic allele frequency. Sci Rep. 2018 May 16;8(1):7735. doi: 10.1038/s41598-018-25462-0. PMID: 29769535; PMCID: PMC5956099.

94. Tougeron D, Lecomte T, Pages JC, Villalva C, Collin C, Ferru A, Tourani JM, Silvain C, Levillain P, Karayan-Tapon L. Effect of low-frequency KRAS mutations on the response to anti-EGFR therapy in metastatic colorectal cancer. Ann Oncol. 2013 May;24(5):1267-73. doi: 10.1093/annonc/mds620. Epub 2013 Jan 4. PMID: 23293113.

95. Balaji SA, Shanmugam A, Chougule A, Sridharan S, Prabhash K, Arya A, Chaubey A, Hariharan A, Kolekar P, Sen M, Ravichandran A, Katragadda S, Sankaran S, Bhargava S, Kulkarni P, Rao S, Sunkavalli C, Banavali S, Joshi A, Noronha V, Dutt A, Bahadur U, Hariharan R, Veeramachaneni V, Gupta V. Analysis of solid tumor mutation profiles in liquid biopsy. Cancer Med. 2018 Nov;7(11):5439-5447. doi: 10.1002/cam4.1791. Epub 2018 Sep 27. PMID: 30264478; PMCID: PMC6246960.

96. Atkins A, Gupta P, Zhang BM, Tsai WS, Lucas J, Javey M, Vora A, Mei R. Detection of Circulating Tumor DNA with a Single-Molecule Sequencing Analysis Validated for Targeted and Immunotherapy Selection. Mol Diagn Ther. 2019 Aug;23(4):521-535. doi: 10.1007/s40291-019-00406-0. PMID: 31209714; PMCID: PMC6675782.

97. Mannakee BK, Balaji U, Witkiewicz AK, Gutenkunst RN, Knudsen ES. Sensitive and specific post-call filtering of genetic variants in xenograft and primary tumors. Bioinformatics. 2018 May 15;34(10):1713-1718. doi: 10.1093/bioinformatics/bty010. PMID: 29325072; PMCID: PMC5946891.

98. Cheng DT, Mitchell TN, Zehir A, Shah RH, Benayed R, Syed A, Chandramohan R, Liu ZY, Won HH, Scott SN, Brannon AR, O'Reilly C, Sadowska J, Casanova J, Yannes A, Hechtman JF, Yao J, Song W, Ross DS, Oultache A, Dogan S, Borsu L, Hameed M, Nafa K, Arcila ME, Ladanyi M, Berger MF. Memorial Sloan Kettering-Integrated Mutation Profiling of Actionable Cancer Targets (MSK-IMPACT): A Hybridization Capture-Based Next-Generation Sequencing Clinical Assay for Solid Tumor Molecular Oncology. J Mol Diagn. 2015 May;17(3):251-64. doi: 10.1016/j.jmoldx.2014.12.006. Epub 2015 Mar 20. PMID: 25801821; PMCID: PMC5808190.

99. Guo Y, Li J, Li CI, Long J, Samuels DC, Shyr Y. The effect of strand bias in Illumina short-read sequencing data. BMC Genomics. 2012 Nov 24;13:666. doi: 10.1186/1471-2164-13-666. PMID: 23176052; PMCID: PMC3532123.

100. McElroy K, Zagordi O, Bull R, Luciani F, Beerenwinkel N. Accurate single nucleotide variant detection in viral populations by combining probabilistic clustering with a statistical test of strand bias. BMC Genomics. 2013 Jul 24;14:501. doi: 10.1186/1471-2164-14-501. PMID: 23879730; PMCID: PMC3848937.

101. Li H. Toward better understanding of artifacts in variant calling from high-coverage samples. Bioinformatics. 2014 Oct 15;30(20):2843-51. doi: 10.1093/bioinformatics/btu356. Epub 2014 Jun 27. PMID: 24974202; PMCID: PMC4271055.

102. Ceyhan-Birsoy PhD O, Misyura M, Mandelker D. A Clinical Approach to Detecting Germline Pathogenic Variants From Tumor-Only Sequencing. JNCI Cancer Spectr. 2020 Mar 5;4(3):pkaa019. doi: 10.1093/jncics/pkaa019. PMID: 32596634; PMCID: PMC7306191.

103. Pritchard CC, Salipante SJ, Koehler K, Smith C, Scroggins S, Wood B, Wu D, Lee MK, Dintzis S, Adey A, Liu Y, Eaton KD, Martins R, Stricker K, Margolin KA, Hoffman N, Churpek JE, Tait JF, King MC, Walsh T. Validation and implementation of targeted capture and sequencing for the detection of actionable mutation, copy number variation, and gene rearrangement in clinical cancer specimens. J Mol Diagn. 2014 Jan;16(1):56-67. doi: 10.1016/j.jmoldx.2013.08.004. Epub 2013 Nov 2. PMID: 24189654; PMCID: PMC3873496.

104. Wagle N, Berger MF, Davis MJ, Blumenstiel B, Defelice M, Pochanard P, Ducar M, Van Hummelen P, Macconaill LE, Hahn WC, Meyerson M, Gabriel SB, Garraway LA. High-throughput detection of actionable genomic alterations in clinical tumor samples by targeted, massively parallel sequencing. Cancer Discov. 2012 Jan;2(1):82-93. doi: 10.1158/2159-8290.CD-11-0184. Epub 2011 Nov 7. PMID: 22585170; PMCID: PMC3353152.

105. Frampton GM, Fichtenholtz A, Otto GA, Wang K, Downing SR, He J, Schnall-Levin M, White J, Sanford EM, An P, Sun J, Juhn F, Brennan K, Iwanik K, Maillet A, Buell J, White E, Zhao M, Balasubramanian S, Terzic S, Richards T, Banning V, Garcia L, Mahoney K, Zwirko Z, Donahue A, Beltran H, Mosquera JM, Rubin MA, Dogan S, Hedvat CV, Berger MF, Pusztai L, Lechner M, Boshoff C, Jarosz M, Vietz C, Parker A, Miller VA, Ross JS, Curran J, Cronin MT, Stephens PJ, Lipson D, Yelensky R. Development and validation of a clinical cancer genomic profiling test based on massively parallel DNA sequencing. Nat Biotechnol. 2013 Nov;31(11):1023-31. doi: 10.1038/nbt.2696. Epub 2013 Oct 20. PMID: 24142049; PMCID: PMC5710001.

106. Goya R, Sun MG, Morin RD, Leung G, Ha G, Wiegand KC, Senz J, Crisan A, Marra MA, Hirst M, Huntsman D, Murphy KP, Aparicio S, Shah SP. SNVMix: predicting single nucleotide variants from next-generation sequencing of tumors. Bioinformatics. 2010 Mar 15;26(6):730-6. doi: 10.1093/bioinformatics/btq040. Epub 2010 Feb 3. PMID: 20130035; PMCID: PMC2832826.

107. Gerstung M, Papaemmanuil E, Campbell PJ. Subclonal variant calling with multiple samples and prior knowledge. Bioinformatics. 2014 May 1;30(9):1198-204. doi: 10.1093/bioinformatics/btt750. Epub 2014 Jan 16. PMID: 24443148; PMCID: PMC3998123.

108. Vallania F, Ramos E, Cresci S, Mitra RD, Druley TE. Detection of rare genomic variants from pooled sequencing using SPLINTER. J Vis Exp. 2012 Jun 23;(64):3943. doi: 10.3791/3943. PMID: 22760212; PMCID: PMC3471313.

109. Wei Z, Wang W, Hu P, Lyon GJ, Hakonarson H. SNVer: a statistical tool for variant calling in analysis of pooled or individual next-generation sequencing data. Nucleic Acids Res. 2011 Oct;39(19):e132. doi: 10.1093/nar/gkr599. Epub 2011 Aug 3. PMID: 21813454; PMCID: PMC3201884.

110. Muller E, Goardon N, Brault B, Rousselin A, Paimparay G, Legros A, Fouillet R, Bruet O, Tranchant A, Domin F, San C, Quesnelle C, Frebourg T, Ricou A, Krieger S, Vaur D, Castera L. OutLyzer: software for extracting low-allele-frequency tumor mutations from sequencing background noise in clinical practice. Oncotarget. 2016 Nov 29;7(48):79485-79493. doi: 10.18632/oncotarget.13103. PMID: 27825131; PMCID: PMC5346729.

111. Dunn T, Berry G, Emig-Agius D, Jiang Y, Lei S, Iyer A, Udar N, Chuang HY, Hegarty J, Dickover M, Klotzle B, Robbins J, Bibikova M, Peeters M, Strömberg M. Pisces: an accurate and versatile variant caller for somatic and germline next-generation sequencing data.

Bioinformatics. 2019 May 1;35(9):1579-1581. doi: 10.1093/bioinformatics/bty849. PMID: 30304370; PMCID: PMC6499249.

112. Kim S, Scheffler K, Halpern AL, Bekritsky MA, Noh E, Källberg M, Chen X, Kim Y, Beyter D, Krusche P, Saunders CT. Strelka2: fast and accurate calling of germline and somatic variants. Nat Methods. 2018 Aug;15(8):591-594. doi: 10.1038/s41592-018-0051-x. Epub 2018 Jul 16. PMID: 30013048.

113. Wilm A, Aw PP, Bertrand D, Yeo GH, Ong SH, Wong CH, Khor CC, Petric R, Hibberd ML, Nagarajan N. LoFreq: a sequence-quality aware, ultra-sensitive variant caller for uncovering cell-population heterogeneity from high-throughput sequencing datasets. Nucleic Acids Res. 2012 Dec;40(22):11189-201. doi: 10.1093/nar/gks918. Epub 2012 Oct 12. PMID: 23066108; PMCID: PMC3526318.

114. Lai Z, Markovets A, Ahdesmaki M, Chapman B, Hofmann O, McEwen R, Johnson J, Dougherty B, Barrett JC, Dry JR. VarDict: a novel and versatile variant caller for next-generation sequencing in cancer research. Nucleic Acids Res. 2016 Jun 20;44(11):e108. doi: 10.1093/nar/gkw227. Epub 2016 Apr 7. PMID: 27060149; PMCID: PMC4914105.

115. Shiraishi Y, Sato Y, Chiba K, Okuno Y, Nagata Y, Yoshida K, Shiba N, Hayashi Y, Kume H, Homma Y, Sanada M, Ogawa S, Miyano S. An empirical Bayesian framework for somatic mutation detection from cancer genome sequencing data. Nucleic Acids Res. 2013 Apr;41(7):e89. doi: 10.1093/nar/gkt126. Epub 2013 Mar 6. PMID: 23471004; PMCID: PMC3627598.

116. Kockan C, Hach F, Sarrafi I, Bell RH, McConeghy B, Beja K, Haegert A, Wyatt AW, Volik SV, Chi KN, Collins CC, Sahinalp SC. SiNVICT: ultra-sensitive detection of single nucleotide variants and indels in circulating tumour DNA. Bioinformatics. 2017 Jan 1;33(1):26-34. doi: 10.1093/bioinformatics/btw536. Epub 2016 Aug 16. PMID: 27531099.

117. Giuliani R, Antonucci I, Torrente I, Grammatico P, Palka G, Stuppia L. Identification of the second CFTR mutation in patients with congenital bilateral absence of vas deferens undergoing ART protocols. Asian J Androl. 2010 Nov;12(6):819-26. doi: 10.1038/aja.2010.58. Epub 2010 Jul 26. PMID: 20657600; PMCID: PMC3739074.

118. Tsiatis AC, Norris-Kirby A, Rich RG, Hafez MJ, Gocke CD, Eshleman JR, Murphy KM. Comparison of Sanger sequencing, pyrosequencing, and melting curve analysis for the detection of KRAS mutations: diagnostic and clinical implications. J Mol Diagn. 2010 Jul;12(4):425-32. doi: 10.2353/jmoldx.2010.090188. Epub 2010 Apr 29. PMID: 20431034; PMCID: PMC2893626.

119. Vollbrecht C, Lehmann A, Lenze D, Hummel M. Validation and comparison of two NGS assays for the detection of EGFR T790M resistance mutation in liquid biopsies of NSCLC patients. Oncotarget. 2018 Apr 6;9(26):18529-18539. doi: 10.18632/oncotarget.24908. PMID: 29719623; PMCID: PMC5915090.

120. Sung JS, Chong HY, Kwon NJ, Kim HM, Lee JW, Kim B, Lee SB, Park CW, Choi JY, Chang WJ, Choi YJ, Lee SY, Kang EJ, Park KH, Kim YH. Detection of somatic variants

and EGFR mutations in cell-free DNA from non-small cell lung cancer patients by ultra-deep sequencing using the ion ampliseq cancer hotspot panel and droplet digital polymerase chain reaction. Oncotarget. 2017 Nov 15;8(63):106901-106912. doi: 10.18632/oncotarget.22456. PMID: 29290998; PMCID: PMC5739783.

121. Papadopoulou E, Tsoulos N, Tsantikidi K, Metaxa-Mariatou V, Stamou PE, Kladi-Skandali A, Kapeni E, Tsaousis G, Pentheroudakis G, Petrakis D, Lampropoulou DI, Aravantinos G,

Varthalitis I, Kesisis G, Boukovinas I, Papakotoulas P, Katirtzoglou N, Athanasiadis E, Stavridi F, Christodoulou C, Koumarianou A, Eralp Y, Nasioulas G. Clinical feasibility of NGS liquid biopsy analysis in NSCLC patients. PLoS One. 2019 Dec 20;14(12):e0226853. doi: 10.1371/journal.pone.0226853. PMID: 31860648; PMCID: PMC6924668.

122. Arsenic R, Treue D, Lehmann A, Hummel M, Dietel M, Denkert C, Budczies J. Comparison of targeted next-generation sequencing and Sanger sequencing for the detection of PIK3CA mutations in breast cancer. BMC Clin Pathol. 2015 Nov 18;15:20. doi: 10.1186/s12907-015-0020-6. PMID: 26587011; PMCID: PMC4652376.

123. Bustin SA. Absolute quantification of mRNA using real-time reverse transcription polymerase chain reaction assays. J Mol Endocrinol. 2000 Oct;25(2):169-93. doi: 10.1677/jme.0.0250169. PMID: 11013345.

124. MacConaill LE. Existing and emerging technologies for tumor genomic profiling. J Clin Oncol. 2013 May 20;31(15):1815-24. doi: 10.1200/JC0.2012.46.5948. Epub 2013 Apr 15. PMID: 23589546; PMCID: PMC3808234.

125. Bryzgunova O, Bondar A, Morozkin E, Mileyko V, Vlassov V, Laktionov P. A reliable method to concentrate circulating DNA. Anal Biochem. 2011 Jan 15;408(2):354-6. doi: 10.1016/j.ab.2010.09.005. Epub 2010 Sep 7. PMID: 20828533.

126. Shi J, Zhang R, Li J, Zhang R. Size profile of cell-free DNA: A beacon guiding the practice and innovation of clinical testing. Theranostics. 2020 Mar 26;10(11):4737-4748. doi: 10.7150/thno.42565. PMID: 32308746; PMCID: PMC7163439.

127. Mouliere F, Chandrananda D, Piskorz AM, Moore EK, Morris J, Ahlborn LB, Mair R, Goranova T, Marass F, Heider K, Wan JCM, Supernat A, Hudecova I, Gounaris I, Ros S, Jimenez-Linan M, Garcia-Corbacho J, Patel K, 0strup O, Murphy S, Eldridge MD, Gale D, Stewart GD, Burge J, Cooper WN, van der Heijden MS, Massie CE, Watts C, Corrie P, Pacey S, Brindle KM, Baird RD, Mau-S0rensen M, Parkinson CA, Smith CG, Brenton JD, Rosenfeld N. Enhanced detection of circulating tumor DNA by fragment size analysis. Sci Transl Med. 2018 Nov 7;10(466):eaat4921. doi: 10.1126/scitranslmed.aat4921. PMID: 30404863; PMCID: PMC6483061.

128. Lapin M, Oltedal S, Tjensvoll K, Buhl T, Smaaland R, Garresori H, Javle M, Glenjen NI, Abelseth BK, Gilje B, Nordgard O. Fragment size and level of cell-free DNA provide prognostic information in patients with advanced pancreatic cancer. J Transl Med. 2018 Nov 6;16(1):300. doi: 10.1186/s12967-018-1677-2. PMID: 30400802; PMCID: PMC6218961.

129. Peter I, Tighiouart H, Lapaire O, Johnson KL, Bianchi DW, Terrin N. Cell-free DNA fragmentation patterns in amniotic fluid identify genetic abnormalities and changes due to storage. Diagn Mol Pathol. 2008 Sep;17(3):185-90. doi: 10.1097/PDM.0b013e31815bcdb6. PMID: 18382362; PMCID: PMC4459511.

130. Bian X, Zhu B, Wang M, Hu Y, Chen Q, Nguyen C, Hicks B, Meerzaman D. Comparing the performance of selected variant callers using synthetic data and genome segmentation. BMC Bioinformatics. 2018 Nov 19;19(1):429. doi: 10.1186/s12859-018-2440-7. PMID: 30453880; PMCID: PMC6245711.

131. Richards S, Aziz N, Bale S, Bick D, Das S, Gastier-Foster J, Grody WW, Hegde M, Lyon E, Spector E, Voelkerding K, Rehm HL; ACMG Laboratory Quality Assurance Committee. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015 May;17(5):405-24. doi: 10.1038/gim.2015.30. Epub 2015 Mar 5. PMID: 25741868; PMCID: PMC4544753.

132. Li H, Ruan J, Durbin R. Mapping short DNA sequencing reads and calling variants using mapping quality scores. Genome Res. 2008 Nov;18(11):1851-8. doi: 10.1101/gr.078212.108. Epub 2008 Aug 19. PMID: 18714091; PMCID: PMC2577856.

133. Lindner MS, Kollock M, Zickmann F, Renard BY. Analyzing genome coverage profiles with applications to quality control in metagenomics. Bioinformatics. 2013 May 15;29(10):1260-7. doi: 10.1093/bioinformatics/btt147. Epub 2013 Apr 14. PMID: 23589648.

134. Ghaffari N, Yousefi MR, Johnson CD, Ivanov I, Dougherty ER. Modeling the next generation sequencing sample processing pipeline for the purposes of classification. BMC Bioinformatics. 2013 Oct 11;14:307. doi: 10.1186/1471-2105-14-307. PMID: 24118904; PMCID: PMC3819514.

135. Sepülveda N, Campino SG, Assefa SA, Sutherland CJ, Pain A, Clark TG. A Poisson hierarchical modelling approach to detecting copy number variation in sequence coverage data. BMC Genomics. 2013 Feb 26;14:128. doi: 10.1186/1471-2164-14-128. PMID: 23442253; PMCID: PMC3679970.

136. Datta S, Datta S, Kim S, Chakraborty S, Gill RS. Statistical Analyses of Next Generation Sequence Data: A Partial Overview. J Proteomics Bioinform. 2010 Jun 1;3(6):183-190. doi: 10.4172/jpb.1000138. PMID: 21113236; PMCID: PMC2989618.

137. Zakrzewski F, Gieldon L, Rump A, Seifert M, Grützmann K, Krüger A, Loos S, Zeugner S, Hackmann K, Porrmann J, Wagner J, Kast K, Wimberger P, Baretton G, Schröck E, Aust D, Klink B. Targeted capture-based NGS is superior to multiplex PCR-based NGS for hereditary BRCA1 and BRCA2 gene analysis in FFPE tumor samples. BMC Cancer. 2019 Apr 27;19(1):396. doi: 10.1186/s12885-019-5584-6. PMID: 31029168; PMCID: PMC6487025.

138. Link WA. Nonidentifiability of population size from capture-recapture data with heterogeneous detection probabilities. Biometrics. 2003 Dec;59(4):1123-30. doi: 10.1111/j.0006-341x.2003.00129.x. PMID: 14969493.

139. Szabo C, Masiello A, Ryan JF, Brody LC. The breast cancer information core: database design, structure, and scope. Hum Mutat. 2000;16(2):123-31. doi: 10.1002/1098-1004(200008)16:2<123::AID-HUMU4>3.0.C0;2-Y. PMID: 10923033.

140. Castellani C; CFTR2 team. CFTR2: How will it help care? Paediatr Respir Rev. 2013 May;14 Suppl 1:2-5. doi: 10.1016/j.prrv.2013.01.006. Epub 2013 Mar 1. PMID: 23466340.

141. Tate JG, Bamford S, Jubb HC, Sondka Z, Beare DM, Bindal N, Boutselakis H, Cole CG, Creatore C, Dawson E, Fish P, Harsha B, Hathaway C, Jupe SC, Kok CY, Noble K, Ponting L, Ramshaw CC, Rye CE, Speedy HE, Stefancsik R, Thompson SL, Wang S, Ward S, Campbell PJ, Forbes SA. COSMIC: the Catalogue Of Somatic Mutations In Cancer. Nucleic Acids Res. 2019 Jan 8;47(D1):D941-D947. doi: 10.1093/nar/gky1015. PMID: 30371878; PMCID: PMC6323903.

142. Rehm HL, Bale SJ, Bayrak-Toydemir P, Berg JS, Brown KK, Deignan JL, Friez MJ, Funke BH, Hegde MR, Lyon E; Working Group of the American College of Medical Genetics and Genomics Laboratory Quality Assurance Commitee. ACMG clinical laboratory standards for next-generation sequencing. Genet Med. 2013 Sep;15(9):733-47. doi: 10.1038/gim.2013.92. Epub 2013 Jul 25. PMID: 23887774; PMCID: PMC4098820.

143. Chen J, Li X, Zhong H, Meng Y, Du H. Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Sci Rep. 2019 Jun 27;9(1):9345. doi: 10.1038/s41598-019-45835-3. PMID: 31249349; PMCID: PMC6597787.

144. Hadigol M, Khiabanian H. MERIT reveals the impact of genomic context on sequencing error rate in ultra-deep applications. BMC Bioinformatics. 2018 Jun 8;19(1):219. doi: 10.1186/s12859-018-2223-1. PMID: 29884116; PMCID: PMC5994075.

145. Wong SQ, Li J, Tan AY, Vedururu R, Pang JM, Do H, Ellul J, Doig K, Bell A, MacArthur GA, Fox SB, Thomas DM, Fellowes A, Parisot JP, Dobrovic A; CANCER 2015 Cohort. Sequence artefacts in a prospective series of formalin-fixed tumours tested for mutations in hotspot regions by massively parallel sequencing. BMC Med Genomics. 2014 May 13;7:23. doi: 10.1186/1755-8794-7-23. PMID: 24885028; PMCID: PMC4032349.

146. Chen G, Mosier S, Gocke CD, Lin MT, Eshleman JR. Cytosine deamination is a major cause of baseline noise in next-generation sequencing. Mol Diagn Ther. 2014 Oct;18(5):587-93. doi: 10.1007/s40291-014-0115-2. PMID: 25091469; PMCID: PMC4175022.

147. Nakamura K, Oshima T, Morimoto T, Ikeda S, Yoshikawa H, Shiwa Y, Ishikawa S, Linak MC, Hirai A, Takahashi H, Altaf-Ul-Amin M, Ogasawara N, Kanaya S. Sequence-specific error profile of Illumina sequencers. Nucleic Acids Res. 2011 Jul;39(13):e90. doi: 10.1093/nar/gkr344. Epub 2011 May 16. PMID: 21576222; PMCID: PMC3141275.

148. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; 1000 Genome Project Data Processing Subgroup. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 2009 Aug 15;25(16):2078-9. doi: 10.1093/bioinformatics/btp352. Epub 2009 Jun 8. PMID: 19505943; PMCID: PMC2723002.

149. Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. doi: 10.1093/bioinformatics/btr509. Epub 2011 Sep 8. PMID: 21903627; PMCID: PMC3198575.

150. Naehrig S, Chao CM, Naehrlich L. Cystic Fibrosis. Dtsch Arztebl Int. 2017 Aug 21;114(33-34):564-574. doi: 10.3238/arztebl.2017.0564. PMID: 28855057; PMCID: PMC5596161.

151. Fujita S, Masago K, Okuda C, Hata A, Kaji R, Katakami N, Hirata Y. Single nucleotide variant sequencing errors in whole exome sequencing using the Ion Proton System. Biomed Rep. 2017 Jul;7(1):17-20. doi: 10.3892/br.2017.911. Epub 2017 May 17. PMID: 28685054; PMCID: PMC5492560.

152. Zheng Q, Huang Y, Zhao H, Yang Y, Hong S, Hou X, Zhao Y, Ma Y, Zhou T, Zhang Y, Fang W, Zhang L. EGFR mutation genotypes affect efficacy and resistance mechanisms of osimertinib in T790M-positive NSCLC patients. Transl Lung Cancer Res. 2020 Jun;9(3):471-483. doi: 10.21037/tlcr.2020.03.35. PMID: 32676311; PMCID: PMC7354104.

153. Jahangiri L, Hurst T. Assessing the Concordance of Genomic Alterations between Circulating-Free DNA and Tumour Tissue in Cancer Patients. Cancers (Basel). 2019 Dec 4;11(12):1938. doi: 10.3390/cancers11121938. PMID: 31817150; PMCID: PMC6966532.

154. Wyatt AW, Annala M, Aggarwal R, Beja K, Feng F, Youngren J, Foye A, Lloyd P, Nykter M, Beer TM, Alumkal JJ, Thomas GV, Reiter RE, Rettig MB, Evans CP, Gao AC, Chi KN, Small EJ, Gleave ME. Concordance of Circulating Tumor DNA and Matched Metastatic Tissue Biopsy in Prostate Cancer. J Natl Cancer Inst. 2017 Dec 1;109(12):djx118. doi: 10.1093/jnci/djx118. PMID: 29206995; PMCID: PMC6440274.

155. Bronkhorst AJ, Ungerer V, Holdenrieder S. The emerging role of cell-free DNA as a molecular marker for cancer management. Biomol Detect Quantif. 2019 Mar 18;17:100087. doi: 10.1016/j.bdq.2019.100087. PMID: 30923679; PMCID: PMC6425120.

156. Bettegowda C, Sausen M, Leary RJ, Kinde I, Wang Y, Agrawal N, Bartlett BR, Wang H, Luber B, Alani RM, Antonarakis ES, Azad NS, Bardelli A, Brem H, Cameron JL, Lee CC, Fecher LA, Gallia GL, Gibbs P, Le D, Giuntoli RL, Goggins M, Hogarty MD, Holdhoff M, Hong SM, Jiao Y, Juhl HH, Kim JJ, Siravegna G, Laheru DA, Lauricella C, Lim M, Lipson EJ, Marie SK, Netto GJ, Oliner KS, Olivi A, Olsson L, Riggins GJ, Sartore-Bianchi A, Schmidt K, Shih lM, Oba-Shinjo SM, Siena S, Theodorescu D, Tie J, Harkins TT, Veronese S, Wang TL, Weingart JD, Wolfgang CL, Wood LD, Xing D, Hruban RH, Wu J, Allen PJ, Schmidt CM, Choti MA, Velculescu VE, Kinzler KW, Vogelstein B, Papadopoulos N, Diaz LA Jr. Detection of circulating tumor DNA in early-and late-stage human malignancies. Sci Transl Med. 2014 Feb 19;6(224):224ra24. doi: 10.1126/scitranslmed.3007094. PMID: 24553385; PMCID: PMC4017867.

157. Xu H, DiCarlo J, Satya RV, Peng Q, Wang Y. Comparison of somatic mutation calling methods in amplicon and whole exome sequence data. BMC Genomics. 2014 Mar 28;15:244. doi: 10.1186/1471-2164-15-244. PMID: 24678773; PMCID: PMC3986649.

158. Arreaza G, Qiu P, Pang L, Albright A, Hong LZ, Marton MJ, Levitan D. Pre-Analytical Considerations for Successful Next-Generation Sequencing (NGS): Challenges and Opportunities for Formalin-Fixed and Paraffin-Embedded Tumor Tissue (FFPE) Samples. Int J Mol Sci. 2016 Sep 20;17(9):1579. doi: 10.3390/ijms17091579. PMID: 27657050; PMCID: PMC5037844.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.