Машинное обучение в виртуальном скрининге на основе структуры биологической мишени: поиск новых ингибиторов танкиразы тема диссертации и автореферата по ВАК РФ 02.00.16, кандидат наук Беришвили Владимир Павлович

  • Беришвили Владимир Павлович
  • кандидат науккандидат наук
  • 2022, ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова»
  • Специальность ВАК РФ02.00.16
  • Количество страниц 142
Беришвили Владимир Павлович. Машинное обучение в виртуальном скрининге на основе структуры биологической мишени: поиск новых ингибиторов танкиразы: дис. кандидат наук: 02.00.16 - Химия и технология композиционных материалов. ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова». 2022. 142 с.

Оглавление диссертации кандидат наук Беришвили Владимир Павлович

Введение

Глава 1. Обзор литературы. Методы виртуального скрининга на

основе структуры биомишени

1.1 Уточнение оценочных функций молекулярного докинга

1.1.1 Классификация оценочных функций

1.1.2 Оценочные функции, основанные на моделях машинного обучения

1.2 Учет конформационной подвижности белка-мишени в

виртуальном скрининге

1.2.1 Неявный учет конформационной подвижности сайта связывания белка

1.2.2 Явный учет конформационной подвижности сайта связывания белка

1.2.3 Неявный учет конформационной подвижности всего белка

1.2.4 Явный учет конформационной подвижности белка

1.2.5 Методы, основанные на анализе траекторий молекулярной динамики

1.2.6 Оценка энергии связывания методами молекулярной динамики

1.3 Контрольные выборки для оценки ожидаемой эффективности

методов виртуального скрининга

1.3.1 Ранние методы создания выборок данных для оценки производительности методов виртуального скрининга

1.3.2 Методы, основанные на анализе химического пространства активных соединений

1.3.3 Критика методов создания контрольных выборок, использующих нормирование по метрике схожести

1.3.4 Метрики качества виртуального скрининга

1.3.5 Границы применимости подходов к генерации контрольных выборок

1.4 Заключение

Глава 2. Результаты и их обсуждение

2.1 Мишень-ориентированные оценочные функции докинга1

2.1.1 Выбор белковых мишеней для апробации метода

2.1.2 Подготовка и отбор данных, генерация условно неактивных соединений

2.1.3 Возможность использования существующих оценочных функций докинга для виртуального скрининга

2.1.4 Разбиение выборок на обучающую и контрольную

2.1.5 Выбор структуры мишени для дальнейшего моделирования

2.1.6 Построение моделей машинного обучения

2.1.7 Валидация классификационной модели для Р13Ка

2.1.8 Анализ полученных результатов

2.1.9 Заключение

2.2 Виртуальный скрининг потенциальных ингибиторов танкираз2

2.2.1 Подготовка выборки соединений для виртуального скрининга

2.2.2 Виртуальный скрининг

2.2.3 Повторный виртуальный скрининг

2.2.4 Заключение

2.3 Прогнозирование связывания лигандов методом анализа траекторий молекулярной динамики3

2.3.1 Описание метода

2.3.2 Модели машинного обучения

2.3.3 Обучающая и контрольные выборки

2.3.4 Результаты тестирования моделей на обучающих выборках

2.3.5 Результаты тестирования моделей на выборках CSAR и

2.3.6 Сравнение с методами, не использующими машинное обучение

2.3.7 Заключение

1 Материалы данного раздела основаны на опубликованной работе автора [182].

2Материалы данного раздела основаны на опубликованной работе автора [201].

3Материалы данного раздела основаны на опубликованной работе автора [215].

Глава 3. Экспериментальная часть

3.1 Фильтрация и отбор структур в формате SMILES

3.2 Прогнозирование параметров ADMET

3.3 Молекулярный докинг

3.4 Молекулярная динамика

3.4.1 Подготовка структур белков

3.4.2 Протокол моделирования молекулярной динамики

3.4.3 Расчет энергий связывания по методу MM-PBSA

3.4.4 Расчет энергий связывания методом FEP

3.5 Модели машинного обучения

3.5.1 Мишень-ориентированные оценочные функции молекулярного докинга

3.5.2 Модели машинного обучения для анализа траекторий молекулярной динамики

3.6 Биологические испытания4

Заключение

Выводы

Словарь терминов

Список литературы

Приложение А. Химические структуры соединений, не показавших

биологическую активность

4Все биологические исследования были выполнены к.б.н. Куимовым А.Н.

Рекомендованный список диссертаций по специальности «Химия и технология композиционных материалов», 02.00.16 шифр ВАК

Введение диссертации (часть автореферата) на тему «Машинное обучение в виртуальном скрининге на основе структуры биологической мишени: поиск новых ингибиторов танкиразы»

Введение

Виртуальный скрининг является одним из наиболее часто применяемых методов поиска новых лекарственных препаратов. Он позволяет существенно ускорить и удешевить ранние этапы разработки лекарственного препарата за счет возможности быстрой оценки потенциальной активности большого числа соединений, многие из которых могут быть еще не синтезированы. Повышение качества существующих, а также разработка новых методов виртуального скрининга позволит увеличить эффективность и результативность начальных этапов создания новых перспективных лекарственных препаратов. Подходы, основанные на структуре биологической мишени, являются одними из основных в виртуальном скрининге веществ с потенциальной биологической активностью. Популярность методов дизайна лекарственных препаратов на основе структуры мишени растет за счет увеличения объема и точности доступной структурной информации о лиганд-белковых комплексах, полученной такими экспериментальными методами, как рентгеноструктурный анализ (РСА), метод ядерного магнитного резонанса (ЯМР), криоэлектронная микроскопия. Помимо экспериментальных методов, в последнее время существенный прогресс наблюдается в решении задачи определения трехмерной конформации белка по его аминокислотной последовательности с помощью вычислительных подходов. В то же время широко используемые методы виртуального скрининга не всегда обеспечивают достаточный для поиска перспективных структур уровень точности и эффективности. Таким образом, актуальность работы обусловлена ростом области применения методов виртуального скрининга на основе структуры мишени, а также возможностями, связанными с обобщением накапливаемой структурной информации о связывании лигандов с белками-мишенями.

В научной литературе вопрос применения виртуального скрининга, как класса вычислительных методов поиска новых соединений с интересующими свойствами из заранее заданного химического пространства, освещен весьма широко. По данным базы PubMed, среди прикладных работ наибольшей популярностью пользуются методы, основанные на фармакофорном поиске, молекулярном докинге и поиске по структурному подобию. Несмотря на общую популярность виртуального скрининга и известные примеры его успешного применения для поиска новых ингибиторов белков, разработке новых мишень-ориентированных

подходов к виртуальному скринингу уделено значительно меньше внимания. Кроме того, ряд перспективных направлений, например, анализ траекторий молекулярной динамики, только начинает набирать популярность за счет увеличения доступности высокопроизводительных вычислительных ресурсов.

Целью работы является разработка и апробация новых методов виртуального скрининга на основе структуры биологической мишени. Для достижения поставленной цели были сформулированы следующие задачи:

1. Проанализировать современные методы виртуального скрининга на основе структуры биологической мишени, в том числе подходы, использующие машинное обучение.

2. Оптимизировать наиболее перспективные мишень-ориентированные методы для повышения эффективности виртуального скрининга.

3. Апробировать разработанные подходы, проведя виртуальный скрининг библиотеки доступных для испытаний соединений.

4. Проанализировать результаты виртуального скрининга и оценить применимость разработанных методов для классификации и ранжирования веществ по значениям активности.

Предмет исследования. Предметом исследования в рамках данной работы являлась оптимизация методов виртуального скрининга для ингибиторов конкретной белковой мишени, для которой доступны структурные данные о связывании лиганда. Кроме того, изучалась применимость методов, связанных с анализом траекторий молекулярной динамики, для задач виртуального скрининга.

Научная новизна: в рамках данной работы впервые разработаны мишень-ориентированные оценочные функции молекулярного докинга на основе моделей машинного обучения и интерпретируемых дескрипторов взаимодействия лиганд-белковых комплексов для виртуального скрининга ингибиторов танкиразы (ТКО) и фосфоинозитид-3-киназы (Р13К) - ключевых компонентов сигнальных путей, связанных с развитием рака толстой и прямой кишки. Был проведен виртуальный скрининг подмножества базы 2ШС15 (всего около 1.7 миллионов соединений), в результате которого были обнаружены 13 ингибиторов танкиразы, принадлежащих к трем структурно различным химическим сериям, со значениями концентрации полуингибирования менее 10 нМ для наиболее активного ингибитора. Кроме того, впервые предложен и реализован подход к анализу тра-

екторий молекулярной динамики для ранжирования соединений по значению их активности с помощью нейросетевых моделей машинного обучения.

Теоретическая и практическая значимость. Теоретическая значимость работы заключается в разработке новых мишень-ориентированных оценочных функций докинга для виртуального скрининга ингибиторов танкиразы, а также в создании метода анализа траекторий молекулярной динамики с целью ранжирования соединений по значению их активности с помощью нейросетевых моделей машинного обучения. Практическая ценность работы состоит в получении данных по активности в отношении белка танкиразы-2 для 36 соединений, отобранных в результате виртуального скрининга из базы данных ZINC15 для биологических испытаний in vitro, а также обнаружении ряда перспективных ингибиторов танкиразы, принадлежащих к трем структурно различным химическим сериям, которые могут стать основой для разработки инновационных противораковых лекарственных средств.

Методология и методы исследования включали постановку задач, сбор и анализ литературных источников, разработку необходимого программного обеспечения, планирование и выполнение вычислительных экспериментов, анализ и обобщение полученных результатов, формулировку выводов. Вычислительные эксперименты проводились с использованием широко применяемых пакетов программ, написанных для языка программирования Python, в соответствии с лучшими практиками работы с биологическими и химическими данными. Ингибирующую активность соединений определяли in vitro путем измерения активности фермента танкиразы с использованием иммунохимического анализа для обнаружения накопления поли (АДФ-рибозы) (PAR) в ходе ферментативной реакции PARP.

Основные положения, выносимые на защиту:

1. Применение методов машинного обучения позволяет повысить скринин-говый потенциал оценочной функции докинга в отношении танкиразы, что отражается в увеличении площади под ROC-кривой с 0.81 до 0.93.

2. Описание траекторий молекулярной динамики многомерными временными рядами может быть применено для обучения регрессионных моделей машинного обучения, связывающих динамику лиганд-белкового комплекса и активность.

3. Сверточные нейронные сети, обученные на многомерных временных рядах, описывающих траекторию молекулярной динамики

лиганд-белкового комплекса, показали свое превосходство над сетями рекуррентной архитектуры в задаче ранжирования соединений тан-киразы по активности, что отражается в значениях коэффициентов корреляции - 0.7 для сверточной нейронной сети и 0.58 для рекуррентной.

4. Из 36 отобранных в результате виртуального скрининга соединений 13 проявляют ингибиторную активность в отношении танкиразы; значения IC50 обнаруженных ингибиторов лежат в интервале от 10 мкМ до 10 нМ.

5. Оценочные функции общего назначения и разработанные классификационные мишень-ориентированные модели ограниченно применимы для ранжирования сходных ингибиторов танкиразы по значению активности.

6. Метод возмущений свободной энергии (FEP) может быть использован для предсказания влияния небольших вариаций структуры молекул на энергию связывания с танкиразой.

Достоверность полученных результатов подтверждается систематической воспроизводимостью результатов расчетов, согласованностью полученных выводов с литературными источниками, использованием современных методов статистического анализа. Результаты работы опубликованы в рецензируемых международных периодических изданиях.

Личный вклад автора состоял в подборе и анализе литературных данных, проведении исследований методами вычислительной химии, в частности, методами анализа химического пространства, моделирования по гомологии, молекулярного докинга, молекулярной динамики, построении количественных моделей структура-активность на основе методов машинного обучения, в интерпретации, обобщении и обсуждении полученных результатов, формулировании выводов, в подготовке материалов к публикациям и представлении их на конференциях. Имена всех соавторов указаны в опубликованных работах. Участие соавторов и организаций, в которых они работают, отражено в тексте диссертации. Во всех опубликованных работах вклад автора является определяющим. Автор принимал активное участие в постановке научных задач, проведении численных исследований, написании кода программ, анализе полученных результатов и подготовке их к публикации. Постановка задач выполнена совместно с научным руководителем Е.В. Радченко, выбор методики проведения биологических испытаний in vitro произведен А.Н. Куимовым. Автором была проведена значительная работа

над текстами статей (черновики работ полностью написаны автором, активное участие в дальнейшем редактировании), а также автор принимал участие в переписке с редакторами и рецензентами.

Публикации и апробация работы. Основные результаты по теме диссертации изложены в 11 печатных работах, из которых 3 изданы в периодических научных журналах, индексируемых Web of Science и Scopus, 8 — в тезисах докладов. Исследования выполнялись при поддержке проектов РФФИ (19-33-50051 мол_нр, 18-515-80028). Основные результаты работы были представлены на международных и российских конференциях. В частности, материалы работы были представлены на 21-ом Европейском Симпозиуме по количественным соотношениям структура-активность (Италия, Верона, 4-8 сентября 2016), 3-й Российской конференции по медицинской химии (Казань, 28 сентября - 3 октября 2017), 22-ом Европейском Симпозиуме по количественным соотношениям структура-активность (Греция, Салоники, 16-20 сентября 2018), XXV Российском национальном конгрессе «Человек и лекарство» (Москва, 9-12 апреля 2018), 10-м Международном симпозиуме по вычислительным методам в токсикологии и фармакологии (Греция, Янина, 23-27 июня 2019), 4-й Российской конференции по медицинской химии (Екатеринбург, 10-14 июня 2019).

Благодарности. Автор выражает благодарность к.х.н. Палюлину Владимиру Александровичу за ценные консультации, полученные в процессе выполнения диссертационной работы. Автор благодарит ГК «ХимРар» за предоставленные образцы веществ. Автор выражает благодарность к.б.н. Куимову Александру Николаевичу за проведение биологических испытаний in vitro. Автор благодарит свою жену, Евгению, за поддержку.

Объем и структура работы. Диссертация состоит из введения, 3 глав, заключения, выводов и 1 приложения. Полный объём диссертации составляет 142 страницы, включая 27 рисунков и 18 таблиц. Список литературы содержит 258 наименований.

Глава 1. Обзор литературы. Методы виртуального скрининга на основе

структуры биомишени.

Виртуальный скрининг является одним из популярных подходов к поиску биологически активных веществ. Данному методу посвящено большое количество публикаций, в том числе обзоры [1; 2]. Кроме того, в 2020 году один из номеров издаваемого Американским химическим обществом журнала Journal of Chemical Information and Modeling был полностью посвящен методам виртуального скрининга. Наиболее заметные изменения за последние годы в виртуальном скрининге, по мнению авторов обзоров, связаны с увеличением числа соединений в скринируемых виртуальных библиотеках. В первую очередь это связывается с ростом доступных вычислительных мощностей и увеличением числа коммерчески доступных веществ [3]. Тем не менее, вопрос о том, действительно ли увеличение размеров библиотеки соединений приводит к улучшению результатов виртуального скрининга, является открытым: согласно мнению авторов работы [4] более важным фактором является структурное разнообразие.

В редакционной статье [2] отмечены следующие актуальные и на сегодняшний день проблемы виртуального скрининга на основе структуры мишени:

1. Выбор доступной структуры лиганд-белкового комплекса для виртуального скрининга на основе структуры биологической мишени;

2. Неточности оценочных функций докинга;

3. Сложность генерации контрольных выборок для валидации методов;

4. Учет влияния растворителя на межмолекулярное взаимодействие в системе лиганд-белок.

Каждая из сформулированных выше проблем сама по себе является обширной областью исследований. В данном обзоре будут подробно рассмотрены только те из них, которые напрямую относятся к разработанным в рамках диссертационной работы методам. Акцент будет сделан на изучении практики формирования контрольных выборок, кроме того, будут детально рассмотрены методы совершенствования оценочных функций и подходы к учету конформационной подвижности системы лиганд-белок. Данные направления, как будет показано далее, тесно взаимосвязаны, и их одновременное развитие может иметь синер-гетический эффект.

1.1 Уточнение оценочных функций молекулярного докинга 1.1.1 Классификация оценочных функций

Несовершенство оценочных функций является одной из основных причин, по которым виртуальный скрининг с использованием молекулярного докинга приводит к значительному количеству как ложноположительных, так и ложно-отрицательных результатов [5]. В первую очередь это связано с несовершенством силовых полей, с помощью которых описывается взаимодействие малой молекулы с сайтом связывания белка-мишени. Как следствие, разработка новых, более точных оценочных функций представляет значительный практический интерес. Оценочные функции докинга призваны решить три взаимосвязанные задачи [6]:

1. Правильное позиционирование лиганда в сайте связывания белка.

2. Классификация соединений на активные и неактивные.

3. Ранжирование соединений по их энергии связывания с белком (и, в идеале, ее точное прогнозирование).

Нередко каждая из них решается специально созданной для подобного класса задач оценочной функцией. Например, одна оценочная функция может применяться на этапе определения оптимальной конформации лиганда и его положения в сайте связывания, тогда как значение второй может рассчитываться уже только для одной или нескольких предпочтительных конформаций. На сегодняшний день доступен широкий выбор оценочных функций, которые по своему происхождению можно условно разделить на три класса [7; 8]:

1. Физически обоснованные функции оценивают аффинность связывания путем суммирования значений межатомных ван-дер-ваальсовых и электростатических взаимодействий. Это делается на основе модели силового поля, часто дополненной с учетом водородных связей, сольватации и гидрофобных контактов.

AG bind = AEvdW + electrostatic + -bond] + AGdesolvation

Среди таких оценочных функций можно отметить MedusaScore [9] и GoldScore [10].

2. Эмпирические оценочные функции. Как правило, в них используется комбинация потенциалов взаимодействия различного происхождения в регрессионной модели.

3. Статистические оценочные функции. Такие оценочные функции выводятся из результатов статистического анализа межатомных расстояний в экспериментально полученных данных о структуре комплексов малых молекул с белками. Примером используемых баз данных могут выступать Cambridge Structural Database или Protein Data Bank.

Несмотря на успехи статистических и эмпирических оценочных функций, крайне важным является понимание физических принципов, обуславливающих взаимодействие лиганда с белком. Так, в обзоре [11] авторы подробно обсуждают статистические закономерности распределения характерных межмолекулярных взаимодействий лиганда и сайта связывания в базе данных PDB. Для того, чтобы эффективно использовать статистические данные при создании оценочной функции, необходимо прочное физическое обоснование релевантности того или иного типа взаимодействия для задачи определения дескрипторов лиганд-белкового взаимодействия. В противном случае существует риск случайных корреляций, которые могут значительно снизить предсказательную силу оценочной функции в последующих исследованиях.

Как наглядно показано в работах группы Клебе [12; 13], нельзя игнорировать неаддитивный по своей природе вклад различных межмолекулярных взаимодействий. В данных публикациях детально описывается явление положительной кооперации гидрофобных взаимодействия и водородных связей, влияющее на энергию связывания ингибиторов тромбина. Подобные примеры часто становятся отправной точкой в рассуждениях, что мишень-ориентированные оценочные функции могут быть полезны в задачах виртуального скрининга. Во-первых, неаддитивность вкладов может быть учтена за счет нелинейности модели, во-вторых, часто закономерности, подобные описанным в работах выше, являются специфичными для каждой системы. Такие оценочные функции, использующие машинное обучение (ML оценочные функции), некоторые исследователи относят к эмпирическим. Основным отличием между функциями, использующими машинное обучение, и классическими эмпирическими оценочными функциями является только тот факт, что в первом случае не используется предопределенная функциональная форма зависимости значения оценочной функции от дескрипторов связывания. Вместо этого на больших наборах данных проводится обучение

модели, связывающей экспериментальные данные и численное описание взаимодействия лигандов с белком-мишенью.

1.1.2 Оценочные функции, основанные на моделях машинного обучения

Согласно литературным данным [14—16], оценочные функции, использующие машинное обучение, показывают наилучшие результаты при оценке энергии связывания лиганда. Существующие подходы используют как оценочные функции общего назначения, обученные на больших объемах экспериментальных данных, так и мишень-ориентированные функции. Для создания оценочных функций используют различные методы машинного обучения, такие как случайный лес (Random Forest), метод опорных векторов (Support Vector Machines) и искусственные нейронные сети (Neural Networks). Используемые оценочные функции различаются не только применяемыми методами машинного обучения, но и дескрипторами, которые обеспечивают численное представление взаимодействий связанного лиганда. Вообще говоря, влияние выбранного представления структуры лиганда и его взаимодействий с сайтом связывания на качество модели очень велико. Методы численного представления структуры лиганда и его взаимодействий с активным сайтом белка сами по себе являются темой активных исследований [17].

Далее для демонстрации разнообразия подходов приводятся отдельные примеры использования машинного обучения для создания оценочных функций. В работе, посвященной оценочной функции RF-Score, авторы использовали случайный лес для модификации оценочной функции Autodock Vina [18]. В работе [19] классификационные и регрессионные модели были построены с использованием метода опорных векторов (SVM), используя дескрипторы формы Property Encoded Shape Distributions (PESD). Авторы работ [20; 21] использовали комбинации характеристик атомов лиганда и окружающих его аминокислот сайта связывания для создания векторов представления лиганд-белковых комплексов с последующим обучением искусственных нейронных сетей. Недавние исследования показали, что существует также и возможность использования сверточных нейронных сетей (CNN) для анализа сайтов связывания [22—24]. Кроме того, в литературе описаны подходы, которые сочетают несколько различных оце-

ночных функций для создания новой консенсусной модели с помощью методов машинного обучения, являясь примером так называемых ансамблевых подходов [25]. В таблице 1 приводятся некоторые оценочные функции, методы машинного обучения и характеристики дескрипторов лиганд-белковых взаимодействий. В таблице представлены различные методы, начиная с относительного простых алгоритмов случайного леса и до искусственных нейронных сетей с сотнями тысяч оптимизируемых параметров. Подобное разнообразие является в первую очередь отражением популярности направления [5].

Таблица 1 — Оценочные функции, основанные на моделях машинного обучения.

Оценочная функция

Метод машинного обучения

Дескрипторы

At0mnet Г231 CNN (сверточные нейронные [ 1 сети)

SVMGen [26]

DeepVS [20]

ÄvinaRF20 [14], ÄvinaXGB [27]

MT-Net, BT-Screen [28]

GNINA [22], KDEEP [29]

Метод опорных векторов

Глубокие нейронные сети

Случайный лес, XGBoost

Градиентный бустинг на решающих деревьях (GBDT), многозадачные нейронные сети

CNN (сверточные нейронные сети)

Структурные дескрипторы

Статистические потенциалы попарного взаимодействия атомов лиганда с сайтом связывания

Межатомные расстояния,типы атомов, частичные заряды и аминокислоты сайта связывания

Компоненты оценочной функции Vina, дескрипторы, описывающие доступную растворителю поверхность молекулы (SASA)

Компоненты оценочной функции Мпа,дескрипторы, описывающие доступную растворителю поверхность молекулы (SASA)

Трехмерные дескрипторы сайта связывания

продолжение следует

(окончание)

Оценочная

функция Метод машинного обучения Дескрипторы

Функции Бехлера-Паринелло GCNN (сверточные (Behler-Parrinello symmetric

GraphDelta [30] нейронные сети на functions; BPS) атомного

молекулярных графах) окружения сайта связывания

_[31]_

Обобщающая способность оценочных функций, использующих машинное обучение. В работе [32], рассматривающей применение мишень-ориентированных оценочных функций докинга в виртуальном скрининге, поднимается ряд интересных вопросов, таких как взаимосвязь классических оценочных функций, оценочных функций с применением машинного обучения (ML) и методов, основанных исключительно на структуре лигандов. В частности, в работе подробно исследуется влияние на количественные характеристики эффективности виртуального скрининга таких параметров, как: (1) метод машинного обучения, (2) метод разбиения выборки на обучающую и контрольную, (3) выбор дескрипторов, описывающих взаимодействия в системе лиганд-мишень. Для проведения исследований используется набор данных LIT-PCBA [33], который будет рассмотрен более подробно далее. Авторы приходят к выводу, что с точки зрения количественных характеристик производительности виртуального скрининга оценочные функции, использующие машинное обучение, показывают в среднем лучшие результаты, чем представители семейства классических функций Glide. Однако важно отметить, что при этом они серьезно уступают моделям, построенным исключительно на дескрипторах структуры ли-ганда (MACCS, ECFP4). Интересно замечание, что худшая производительность в сравнении с методами, использующими только данные о структуре лигандов, вероятно, обусловлена менее выразительным описанием взаимодействий лиган-да, особенно это заметно при сравнении фингерпринтов MACCS и подходов, использующих значения попарных атомных взаимодействий. В классическом варианте (MACCS) структурная информация о лиганде используется в готовом виде, тогда как ML оценочные функции докинга используют менее точно определяющие строение лиганда потенциалы взаимодействий. Отмечается, что, несмотря на объективно худшие показатели для классических функций, лучшие по их оценкам вещества, оказавшиеся активными, более структурно отличны

от известных активных, чем те, которые были получены моделями машинного обучения, построенными на дескрипторах структуры лиганда. Авторы приходят к выводу, что наиболее целесообразно сравнивать производительность оценочных функций докинга, использующих машинное обучение, не с классическими оценочными функциями, а с подходами, опирающимися на структуру лиган-дов. Авторы обосновывают это тем, что по своим свойствам такие оценочные функции гораздо ближе к последним.

Другое направление критики развивается в публикации [34]. Авторы связывают лучшие результаты ML-оценочных функций относительно классических не с более точным описанием физики взаимодействия лиганда с белком, а с искусственным обогащением на конкретных контрольных выборках. По мнению авторов, методы машинного обучения за счет большой гибкости могут в неявном виде использовать информацию о способах, посредством которых были созданы синтетические контрольные выборки.

С другой стороны, по мнению авторов обзора [35], эта и многие другие критические оценки ML функций докинга не учитывают ряд важных фактов. Так, среди прочего, существуют оценочные функции, использующие машинное обучение, для которых была показана большая обобщающая способность, чем для классических. В качестве примеров можно привести обученные на наборе данных DUD-E оценочные функции на сверточных нейронных сетях [22], а также работу [36], в которой утверждается, что применение ML оценочных функций позволило правильно классифицировать в 3-4 раза больше активных соединений, чем с помощью классической оценочной функции Vina. При этом тестирование производительности проводилось на выборках, основанных на данных базы ChEMBL. Схожие выводы были сделаны и в работах [37; 38] на контрольных выборках DEKOIS 2.0. Таким образом, на сегодняшний день дискуссия о полезности ML оценочных функций остается открытой и требует тщательной экспериментальной проверки.

Похожие диссертационные работы по специальности «Химия и технология композиционных материалов», 02.00.16 шифр ВАК

Список литературы диссертационного исследования кандидат наук Беришвили Владимир Павлович, 2022 год

Список литературы

1. Stumpfe, D. Current Trends, Overlooked Issues, and Unmet Challenges in Virtual Screening / D. Stumpfe, J. Bajorath // J. Chem. Inf. Model. — 2020. — Sept. — Vol. 60, no. 9. - P. 4112-4115.

2. Walters, W. P. New Trends in Virtual Screening / W. P. Walters, R. Wang // J. Chem. Inf. Model. — 2020. — Sept. — Vol. 60, no. 9. — P. 4109-4111.

3. Walters, W. P. Virtual Chemical Libraries / W. P. Walters // J. Med. Chem. — 2019.-Feb.-Vol. 62, no. 3.-P. 1116-1124.

4. Clark, D. E. Virtual Screening: Is Bigger Always Better? Or Can Small Be Beautiful? / D. E. Clark // J. Chem. Inf. Model. — 2020. — Sept. — Vol. 60, no. 9. — P. 4120-4123.

5. Batool, M. A Structure-Based Drug Discovery Paradigm / M. Batool, B. Ahmad, S. Choi // Int. J. Mol. Sci. — 2019. — June. — Vol. 20, no. 11.

6. Li, J. An Overview of Scoring Functions Used for Protein-Ligand Interactions in Molecular Docking / J. Li, A. Fu, L. Zhang // Interdiscip. Sci. — 2019. — June. — Vol. 11, no. 2.-P. 320-328.

7. Zhang, W. Computational Multitarget Drug Design / W. Zhang, J. Pei, L. Lai // J. Chem. Inf. Model. — 2017. — Mar. — Vol. 57, no. 3. — P. 403—412.

8. Liu, ./.Classification of current scoring functions / J. Liu, R. Wang // J. Chem. Inf. Model. — 2015. — Mar. — Vol. 55, no. 3. — P. 475—482.

9. MedusaScore: an accurate force field-based scoring function for virtual drug screening / S. Yin, L. Biedermannova, J. Vondrasek, N. V. Dokholyan // J. Chem. Inf. Model. — 2008. — Aug. — Vol. 48, no. 8. — P. 1656—1662.

10. Improved protein-ligand docking using GOLD / M. L. Verdonk, J. C. Cole, M. J. Hartshorn, C. W. Murray, R. D. Taylor // Proteins. — 2003. — Sept. — Vol. 52, no. 4. — P. 609—623.

11. Bissantz, C. A medicinal chemist's guide to molecular interactions / C. Bissantz, B. Kuhn, M. Stahl // J. Med. Chem. — 2010. — July. — Vol. 53, no. 14. — P. 5061—5084.

12. Enhancement of hydrophobic interactions and hydrogen bond strength by co-operativity: synthesis, modeling, and molecular dynamics simulations of a congeneric series of thrombin inhibitors / L. Muley, B. Baum, M. Smolinski, M. Freindorf, A. Heine, G. Klebe, D. G. Hangauer // J. Med. Chem. — 2010. — Mar. — Vol. 53, no. 5. — P. 2126—2135.

13. Non-additivity of functional group contributions in protein-ligand binding: a comprehensive study by crystallography and isothermal titration calorimetry / B. Baum, L. Muley, M. Smolinski, A. Heine, D. Hangauer, G. Klebe // J. Mol. Biol. — 2010. — Apr. — Vol. 397, no. 4. — P. 1042—1054.

14. Wang, C. Improving scoring-docking-screening powers of protein-ligand scoring functions using random forest / C. Wang, Y. Zhang //J. Comput. Chem. — 2017. — Jan. — Vol. 38, no. 3. — P. 169—177.

15. Use of machine learning approaches for novel drug discovery / A. N. Lima, E. A. Philot, G. H. G. Trossini, L. P. B. Scott, V. G. Maltarollo, K. M. Honorio // Expert Opin. Drug Discov. — 2016. — Vol. 11, no. 3. — P. 225—239.

16. Wójcikowski, M. Performance of machine-learning scoring functions in structure-based virtual screening / M. Wójcikowski, P. J. Ballester, P. Siedlecki // Sci. Rep. — 2017. — Apr. — Vol. 7. — P. 46710.

17. Chuang, K. V. Learning Molecular Representations for Medicinal Chemistry / K. V. Chuang, L. M. Gunsalus, M. J. Keiser // J. Med. Chem. — 2020. — Aug. — Vol. 63, no. 16. — P. 8705—8722.

18. Zilian, D. SFCscore(RF): a random forest-based scoring function for improved affinity prediction of protein-ligand complexes / D. Zilian, C. A. Sotriffer // J. Chem. Inf. Model. — 2013. — Aug. — Vol. 53, no. 8. — P. 1923—1933.

19. Das, S. Binding affinity prediction with property-encoded shape distribution signatures / S. Das, M. P. Krein, C. M. Breneman // J. Chem. Inf. Model. — 2010. — Feb. — Vol. 50, no. 2. — P. 298—308.

20. Pereira, J. C. Boosting Docking-Based Virtual Screening with Deep Learning / J. C. Pereira, E. R. Caffarena, C. N. Dos Santos // J. Chem. Inf. Model. — 2016. — Dec. — Vol. 56, no. 12. — P. 2495—2506.

21. Durrant, J. D. NNScore: a neural-network-based scoring function for the characterization of protein-ligand complexes / J. D. Durrant, J. A. McCammon // J. Chem. Inf. Model. — 2010. — Oct. — Vol. 50, no. 10. — P. 1865—1871.

22. Protein-Ligand Scoring with Convolutional Neural Networks / M. Ragoza, J. Hochuli, E. Idrobo, J. Sunseri, D. R. Koes // J. Chem. Inf. Model. — 2017. — Apr. — Vol. 57, no. 4. — P. 942—957.

23. Wallach, I. AtomNet: A Deep Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery / I. Wallach, M. Dzamba, A. Heifets. — 2015. —arXiv: 1510.02855 [cs.LG].

24. GNINA 1.0: molecular docking with deep learning / A. T. McNutt, P. Francoeur, R. Aggarwal, T. Masuda, R. Meli, M. Ragoza, J. Sunseri, D. R. Koes // J. Chem-inform. — 2021. — June. — Vol. 13, no. 1. — P. 43.

25. Machine Learning Consensus Scoring Improves Performance Across Targets in Structure-Based Virtual Screening / S. S. Ericksen, H. Wu, H. Zhang, L. A. Michael, M. A. Newton, F. M. Hoffmann, S. A. Wildman // J. Chem. Inf. Model. — 2017. — July. — Vol. 57, no. 7. — P. 1579—1590.

26. Xu, D. Effect of Binding Pose and Modeled Structures on SVMGen and GlideScore Enrichment of Chemical Libraries / D. Xu, S. O. Meroueh // J. Chem. Inf. Model. — 2016. — June. — Vol. 56, no. 6. — P. 1139—1151.

27. Incorporating Explicit Water Molecules and Ligand Conformation Stability in Machine-Learning Scoring Functions / J. Lu, X. Hou, C. Wang, Y. Zhang // J. Chem. Inf. Model. — 2019. — Nov. — Vol. 59, no. 11. — P. 4540—4549.

28. Ashtawy, H. M. Task-Specific Scoring Functions for Predicting Ligand Binding Poses and Affinity and for Screening Enrichment / H. M. Ashtawy, N. R. Maha-patra // J. Chem. Inf. Model. — 2018. — Jan. — Vol. 58, no. 1. — P. 119—133.

29. K: Protein-Ligand Absolute Binding Affinity Prediction via 3D-Convolutional

V

Neural Networks / J. Jiménez, M. Skalic, G. Martínez-Rosell, G. De Fabritiis // J. Chem. Inf. Model. — 2018. — Feb. — Vol. 58, no. 2. — P. 287—296.

30. graphDelta: MPNN Scoring Function for the Affinity Prediction of Protein-Ligand Complexes / D. S. Karlov, S. Sosnin, M. V. Fedorov, P. Popov // ACS Omega. — 2020. — Vol. 5, no. 10. — P. 5150—5159. — PMID: 32201802.

31. Behler, /.Generalized neural-network representation of high-dimensional potential-energy surfaces / J. Behler, M. Parrinello // Phys. Rev. Lett. — 2007. — Apr. — Vol. 98, no. 14. — P. 146401.

32. Accuracy or novelty: what can we gain from target-specific machine-learning-based scoring functions in virtual screening? / C. Shen, G. Weng, X. Zhang,

E. L.-H. Leung, X. Yao, J. Pang, X. Chai, D. Li, E. Wang, D. Cao, T. Hou // Brief. Bioinform. — 2021. — Sept. — Vol. 22, no. 5.

33. Tran-Nguyen, V.-K. LIT-PCBA: An Unbiased Data Set for Machine Learning and Virtual Screening / V.-K. Tran-Nguyen, C. Jacquemard, D. Rognan // J. Chem. Inf. Model. — 2020. — Sept. — Vol. 60, no. 9. — P. 4263—4273.

34. Sieg, J. In Need of Bias Control: Evaluating Chemical Data for Machine Learning in Structure-Based Virtual Screening / J. Sieg, F. Flachsenberg, M. Rarey // J. Chem. Inf. Model. — 2019. — Mar. — Vol. 59, no. 3. — P. 947—961.

35. Machine-learning scoring functions for structure-based virtual screening / H. Li, K.-H. Sze, G. Lu, P. J. Ballester // Wiley Interdiscip. Rev. Comput. Mol. Sci. — 2021. —Jan. —Vol. 11, no. 1.

36. Protein Family-Specific Models Using Deep Neural Networks and Transfer Learning Improve Virtual Screening and Highlight the Need for More Data /

F. Imrie, A. R. Bradley, M. van der Schaar, C. M. Deane // J. Chem. Inf. Model. —

2018. - Nov. - Vol. 58, no. 11. — P. 2319-2330.

37. DLIGAND2: an improved knowledge-based energy function for protein-ligand interactions using the distance-scaled, finite, ideal-gas reference state / P. Chen, Y. Ke, Y. Lu, Y. Du, J. Li, H. Yan, H. Zhao, Y. Zhou, Y. Yang // J. Cheminform. -

2019.—Aug.—Vol. 11, no. 1.—P. 52.

38. Yasuo, N.Improved Method of Structure-Based Virtual Screening via Interaction-Energy-Based Learning / N. Yasuo, M. Sekijima // J. Chem. Inf. Model. —2019. — Mar. — Vol. 59, no. 3. — P. 1050—1061.

39. TS-Chemscore, a Target-Specific Scoring Function, Significantly Improves the Performance of Scoring in Virtual Screening / W.-J. Wang, Q. Huang, J. Zou, L.-L. Li, S.-Y. Yang//Chem. Biol. DrugDes. -2015. - July. - Vol. 86, no. 1. -P. 1-8.

40. A comparative study of family-specific protein-ligand complex affinity prediction based on random forest approach / Y. Wang, Y. Guo, Q. Kuang, X. Pu, Y. Ji, Z. Zhang, M. Li // J. Comput. Aided Mol. Des. — 2015. — Apr. — Vol. 29, no. 4. — P. 349—360.

41. Fourches, D. Target-specific native/decoy pose classifier improves the accuracy of ligand ranking in the CSAR 2013 benchmark / D. Fourches, R. Politi, A. Trop-sha // J. Chem. Inf. Model. — 2015. — Jan. — Vol. 55, no. 1. — P. 63—71.

42. Discovery ofNovel Disruptor of Silencing Telomeric 1-Like (DOT1L) Inhibitors using a Target-Specific Scoring Function for the (S)-Adenosyl-l-methionine (SAM)-Dependent Methyltransferase Family / Y. Wang, L. Li, B. Zhang, J. Xing, S. Chen, W. Wan, Y. Song, H. Jiang, H. Jiang, C. Luo, M. Zheng // J. Med. Chem. — 2017. — Mar. — Vol. 60, no. 5. — P. 2026—2036.

43. Structure-Based Target-Specific Screening Leads to Small-Molecule CaMKII Inhibitors / D. Xu, L. Li, D. Zhou, D. Liu, A. Hudmon, S. O. Meroueh // ChemMedChem. — 2017. — May. — Vol. 12, no. 9. — P. 660—677.

44. Function-specific virtual screening for GPCR ligands using a combined scoring method / A. J. Kooistra, H. F. Vischer, D. McNaught-Flores, R. Leurs, I. J. P. de Esch, C. de Graaf// Sci. Rep. - 2016. - June. - Vol. 6. - P. 28288.

45. Singh, N.Fast Rescoring Protocols to Improve the Performance of Structure-Based Virtual Screening Performed on Protein-Protein Interfaces / N. Singh, L. Chaput, B. O. Villoutreix // J. Chem. Inf. Model. — 2020. — Aug. — Vol. 60, no. 8.-P. 3910-3934.

46. GSK789: A selective inhibitor of the first bromodomains (BD1) ofthebromo and extra terminal domain (BET) proteins / R. J. Watson, P. Bamborough, H. Barnett, C.-W. Chung, R. Davis, L. Gordon, P. Grandi, M. Petretich, A. Phillipou, R. K. Prinjha, I. Rioja, P. Soden, T. Werner, E. H. Demont // J. Med. Chem. — 2020. — Sept. — Vol. 63, no. 17. — P. 9045—9069.

47. BET bromodomain ligands: Probing the WPF shelf to improve BRD4 bromodomain affinity and metabolic stability / L. E. Jennings, M. Schiedel, D. S. Hewings, S. Picaud, C. M. C. Laurin, P. A. Bruno, J. P. Bluck, A. R. Sco-rah, L. See, J. K. Reynolds, M. Moroglu, I. N. Mistry, A. Hicks, P. Guzanov, J. Clayton, C. N. G. Evans, G. Stazi, P. C. Biggin, A. K. Mapp, E. M. Hammond, P. G. Humphreys, P. Filippakopoulos, S. J. Conway // Bioorg. Med. Chem. — 2018. — July. — Vol. 26, no. 11. — P. 2937—2957.

48. Structure-Based Design of Inhibitors of Protein-Protein Interactions: Mimicking Peptide Binding Epitopes / M. Pelay-Gimeno, A. Glas, O. Koch, T. N. Grossmann // Angew. Chem. Int. Ed Engl. — 2015. — July. — Vol. 54, no. 31. — P. 8896-8927.

49. Arkin, M. R. Small-molecule inhibitors of protein-protein interactions: progressing toward the reality / M. R. Arkin, Y. Tang, J. A. Wells // Chem. Biol. — 2014. - Sept. - Vol. 21, no. 9. - P. 1102-1114.

50. New machine learning and physics-based scoring functions for drug discovery / I. A. Guedes, A. M. S. Barreto, D. Marinho, E. Krempser, M. A. Kuenemann, O. Sperandio, L. E. Dardenne, M. A. Miteva // Sci. Rep. — 2021. — Feb. — Vol. 11, no. 1. —P. 3198.

51. Kuhn, B. Binding of a diverse set of ligands to avidin and streptavidin: an accurate quantitative prediction of their relative affinities by a combination of molecular mechanics and continuum solvent models / B. Kuhn, P. A. Kollman // J. Med. Chem. — 2000. — Oct. — Vol. 43, no. 20. — P. 3786—3791.

52. Nogueira, M. S. The Development of Target-Specific Machine Learning Models as Scoring Functions for Docking-Based Target Prediction / M. S. Nogueira, O. Koch // J. Chem. Inf. Model. — 2019. — Mar. — Vol. 59, no. 3. — P. 1238-1252.

53. /ones, G. Molecular recognition of receptor sites using a genetic algorithm with a description of desolvation / G. Jones, P. Willett, R. C. Glen // J. Mol. Biol. — 1995. — Jan. — Vol. 245, no. 1. — P. 43—53.

54. Korb, O. Empirical scoring functions for advanced protein-ligand docking with PLANTS / O. Korb, T. Stutzle, T. E. Exner // J. Chem. Inf. Model. — 2009. — Jan. — Vol. 49, no. 1. — P. 84—96.

55. Beware of the generic machine learning-based scoring functions in structure-based virtual screening / C. Shen, Y. Hu, Z. Wang, X. Zhang, J. Pang, G. Wang, H. Zhong, L. Xu, D. Cao, T. Hou // Brief. Bioinform. — 2021. — May. — Vol. 22, no. 3.

56. Adeshina, Y. O. Machine learning classification can reduce false positives in structure-based virtual screening / Y. O. Adeshina, E. J. Deeds, J. Karanico-las // Proc. Natl. Acad. Sci. U. S. A. - 2020. - Aug. - Vol. 117, no. 31. -P. 18477—18488.

57. Lill, M. A. Efficient incorporation of protein flexibility and dynamics into molecular docking simulations / M. A. Lill // Biochemistry. — 2011. — July. — Vol. 50, no. 28.—P. 6157—6169.

58. Wong, C. F. Flexible receptor docking for drug discovery / C. F. Wong // Expert Opin. Drug Discov. — 2015. — Aug. — Vol. 10, no. 11. — P. 1189—1200.

59. Changeux, J.-P. Conformational selection or induced fit? 50 years of debate resolved / J.-P. Changeux, S. Edelstein // F1000 Biol. Rep. — 2011. — Sept. — Vol. 3.—P. 19.

60. How does a drug molecule find its target binding site? / Y. Shan, E. T. Kim, M. P. Eastwood, R. O. Dror, M. A. Seeliger, D. E. Shaw// J. Am. Chem. Soc. — 2011. - June. - Vol. 133, no. 24. - P. 9181-9183.

61. The ligand binding mechanism to purine nucleoside phosphorylase elucidated via molecular dynamics and machine learning / S. Decherchi, A. Berteotti, G. Bottegoni, W. Rocchia, A. Cavalli // Nat. Commun. — 2015. — Jan. — Vol. 6.—P. 6155.

62. Anton, a special-purpose machine for molecular dynamics simulation / D. E. Shaw, M. M. Deneroff, R. O. Dror, J. S. Kuskin, R. H. Larson, J. K. Salmon, C. Young, B. Batson, K. J. Bowers, J. C. Chao, M. P. Eastwood, J. Gagliardo, J. P. Grossman, C. R. Ho, D. J. Ierardi, I. Kolossvary, J. L. Klepeis, T. Layman, C. McLeavey, M. A. Moraes, R. Mueller, E. C. Priest, Y. Shan, J. Spengler, M. Theobald, B. Towles, S. C. Wang // Commun. ACM. — 2008. — July. — Vol. 51, no. 7.—P. 91—97.

63. Antunes, D. A. Understanding the challenges of protein flexibility in drug design / D. A. Antunes, D. Devaurs, L. E. Kavraki // Expert Opin. Drug Discov. — 2015.-Dec.-Vol. 10, no. 12.-P. 1301-1313.

64. Jiang, F. "Soft docking": matching of molecular surface cubes / F. Jiang, S. H. Kim // J. Mol. Biol. — 1991. — May. — Vol. 219, no. 1. — P. 79—102.

65. Soft docking and multiple receptor conformations in virtual screening / A. M. Ferrari, B. Q. Wei, L. Costantino, B. K. Shoichet // J. Med. Chem. — 2004. — Oct. — Vol. 47, no. 21. — P. 5076—5084.

66. Buonfiglio, R. Protein Flexibility in Drug Discovery: From Theory to Computation / R. Buonfiglio, M. Recanatini, M. Masetti // ChemMedChem. — 2015. — July. — Vol. 10, no. 7. — P. 1141—1148.

67. Exploring the role of receptor flexibility in structure-based drug discovery / F. Feixas, S. Lindert, W. Sinko, J. A. McCammon // Biophys. Chem. — 2014. — Feb.— Vol. 186.—P. 31—45.

68. Novel procedure for modeling ligand/receptor induced fit effects / W. Sherman, T. Day, M. P. Jacobson, R. A. Friesner, R. Farid // J. Med. Chem. — 2006. — Jan. — Vol. 49, no. 2. — P. 534—553.

69. Venkatraman, V. Flexible protein docking refinement using pose-dependent normal mode analysis / V. Venkatraman, D. W. Ritchie // Proteins. — 2012. — Aug. — Vol. 80, no. 9. — P. 2262—2274.

70. Extra precision glide: docking and scoring incorporating a model of hydropho-bic enclosure for protein-ligand complexes / R. A. Friesner, R. B. Murphy, M. P. Repasky, L. L. Frye, J. R. Greenwood, T. A. Halgren, P. C. Sanschagrin, D. T. Mainz//J. Med. Chem. — 2006. — Oct. — Vol. 49, no. 21. — P. 6177—6196.

71. Abagyan, R. ICM?A new method for protein modeling and design: Applications to docking and structure prediction from the distorted native conformation / R. Abagyan, M. Totrov, D. Kuznetsov // J. Comput. Chem. — 1994. — May. — Vol. 15, no. 5.—P. 488—506.

72. Computational protein-ligand docking and virtual drug screening with the AutoDock suite / S. Forli, R. Huey, M. E. Pique, M. F. Sanner, D. S. Goodsell, A. J. Olson // Nat. Protoc. — 2016. — May. — Vol. 11, no. 5. — P. 905—919.

73. Trott, O. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading / O. Trott, A. J. Olson//J. Comput. Chem. —2010. — Jan. — Vol. 31, no. 2. — P. 455—461.

74. AutoDock Vina 1.2.0: New Docking Methods, Expanded Force Field, and Python Bindings / J. Eberhardt, D. Santos-Martins, A. F. Tillack, S. Forli // J. Chem. Inf. Model. — 2021. — Aug. — Vol. 61, no. 8. — P. 3891—3898.

75. Ding, F. Rapid flexible docking using a stochastic rotamer library of ligands / F. Ding, S. Yin, N. V. Dokholyan // J. Chem. Inf. Model. - 2010. - Sept. -Vol. 50, no. 9. - P. 1623-1632.

76. Schumann, M. Systematic and efficient side chain optimization for molecular docking using a cheapest-path procedure / M. Schumann, R. S. Armen // J. Comput. Chem. — 2013. — May. — Vol. 34, no. 14. — P. 1258—1269.

77. Four-dimensional docking: a fast and accurate account of discrete receptor flexibility in ligand docking / G. Bottegoni, I. Kufareva, M. Totrov, R. Abagyan // J. Med. Chem. — 2009. — Jan. — Vol. 52, no. 2. — P. 397—406.

78. The relaxed complex method: Accommodating receptor flexibility for drug design with an improved scoring scheme / J.-H. Lin, A. L. Perryman, J. R. Schames, J. A. McCammon // Biopolymers. — 2003. — Jan. — Vol. 68, no. 1. — P. 47—62.

79. Multi-conformer ensemble docking to difficult protein targets / S. R. Ellingson, Y. Miao, J. Baudry, J. C. Smith // J. Phys. Chem. B. - 2015. - Jan. - Vol. 119, no. 3.-P. 1026-1034.

80. May, A. Protein-ligand docking accounting for receptor side chain and global flexibility in normal modes: evaluation on kinase inhibitor cross docking / A. May, M. Zacharias // J. Med. Chem. — 2008. — June. — Vol. 51, no. 12. — P. 3499-3506.

81. Leis, S. Efficient inclusion of receptor flexibility in grid-based protein-ligand docking / S. Leis, M. Zacharias // J. Comput. Chem. — 2011. — Dec. — Vol. 32, no. 16.-P. 3433-3439.

82. Systematic exploitation of multiple receptor conformations for virtual ligand screening / G. Bottegoni, W. Rocchia, M. Rueda, R. Abagyan, A. Cavalli // PLoS One.— 2011.—May. —Vol. 6, no. 5. — e18845.

83. Consensus Induced Fit Docking (cIFD): methodology, validation, and application to the discovery of novel Crm1 inhibitors / O. Kalid, D. Toledo Warshaviak, S. Shechter, W. Sherman, S. Shacham // J. Comput. Aided Mol. Des. — 2012. — Nov. — Vol. 26, no. 11. — P. 1217—1228.

84. Ding, F. Incorporating backbone flexibility in MedusaDock improves ligand-binding pose prediction in the CSAR2011 docking benchmark / F. Ding, N. V. Dokholyan // J. Chem. Inf. Model. — 2013. — Aug. — Vol. 53, no. 8. — P. 1871—1879.

85. Wang, /. MedusaDock 2.0: Efficient and Accurate Protein-Ligand Docking With Constraints / J. Wang, N. V. Dokholyan// J. Chem. Inf. Model. — 2019. — June. — Vol. 59, no. 6. — P. 2509—2515.

86. Bordogna, A. Predicting the accuracy of protein-ligand docking on homology models / A. Bordogna, A. Pandini, L. Bonati // J. Comput. Chem. — 2011. — Jan. — Vol. 32, no. 1. — P. 81—98.

87. Barril, X. Unveiling the full potential of flexible receptor docking using multiple crystallographic structures / X. Barril, S. D. Morley // J. Med. Chem. — 2005. — June. — Vol. 48, no. 13. — P. 4432-4443.

88. Awuni, Y. Reduction of false positives in structure-based virtual screening when receptor plasticity is considered / Y. Awuni, Y. Mu // Molecules. — 2015. — Mar. — Vol. 20, no. 3. — P. 5152—5164.

89. Using machine learning to improve ensemble docking for drug discovery / T. Chandak, J. P. Mayginnes, H. Mayes, C. F. Wong // Proteins. — 2020. — Oct. — Vol. 88, no. 10. — P. 1263—1270.

90. Fukunishi, Y. Structural ensemble in computational drug screening / Y. Fukun-ishi // Expert Opin. Drug Metab. Toxicol. — 2010. — July. — Vol. 6, no. 7. — P. 835—849.

91. ALADDIN: Docking Approach Augmented by Machine Learning for Protein Structure Selection Yields Superior Virtual Screening Performance / N. Fan, C. A. Bauer, C. Stork, C. de Bruyn Kops, J. Kirchmair // Mol. Inform. — 2020. — Apr. — Vol. 39, no. 4. — e1900103.

92. Clustering molecular dynamics trajectories for optimizing docking experiments / R. De Paris, C. V. Quevedo, D. D. Ruiz, O. Norberto de Souza, R. C. Barros // Comput. Intell. Neurosci. — 2015. — Mar. — Vol. 2015. — P. 916240.

93. Xu, M. Utilizing experimental data for reducing ensemble size in flexible-protein docking / M. Xu, M. A. Lill // J. Chem. Inf. Model. — 2012. — Jan. — Vol. 52, no. 1.—P. 187—198.

94. Assessing an ensemble docking-based virtual screening strategy for kinase targets by considering protein flexibility / S. Tian, H. Sun, P. Pan, D. Li, X. Zhen, Y. Li, T. Hou // J. Chem. Inf. Model. — 2014. — Oct. — Vol. 54, no. 10. — P. 2664-2679.

95. Xie, B. Efficiency of Stratification for Ensemble Docking Using Reduced Ensembles / B. Xie, J. D. Clark, D. D. L. Minh // J. Chem. Inf. Model. — 2018. — Sept. — Vol. 58, no. 9. — P. 1915—1925.

96. Ensemble Docking in Drug Discovery: How Many Protein Configurations from Molecular Dynamics Simulations are Needed To Reproduce Known Ligand Binding? / W. Evangelista Falcon, S. R. Ellingson, J. C. Smith, J. Baudry // J. Phys. Chem. B. — 2019. — June. — Vol. 123, no. 25. — P. 5189—5195.

97. Reliable and Accurate Solution to the Induced Fit Docking Problem for Protein-Ligand Binding / E. B. Miller, R. B. Murphy, D. Sindhikara, K. W. Borrelli, M. J. Grisewood, F. Ranalli, S. L. Dixon, S. Jerome, N. A. Boyles, T. Day, P. Ghanakota, S. Mondal, S. B. Rafi, D. M. Troast, R. Abel, R. A. Friesner // J. Chem. Theory Comput. — 2021. — Apr. — Vol. 17, no. 4. — P. 2630—2639.

98. Roskoski Jr, R. Classification of small molecule protein kinase inhibitors based upon the structures of their drug-enzyme complexes / R. Roskoski Jr // Pharmacol. Res. — 2016. — Jan. — Vol. 103. — P. 26—48.

99. Roskoski Jr, R. Properties of FDA-approved small molecule protein kinase inhibitors: A 2021 update / R. Roskoski Jr // Pharmacol. Res. — 2021. — Mar. — Vol. 165.—P. 105463.

100. Kufareva, I. Type-II kinase inhibitor docking, screening, and profiling using modified structures of active kinase states /1. Kufareva, R. Abagyan // J. Med. Chem. — 2008. — Dec. — Vol. 51, no. 24. — P. 7921—7932.

101. Role of Molecular Dynamics and Related Methods in Drug Discovery / M. De Vivo, M. Masetti, G. Bottegoni, A. Cavalli // J. Med. Chem. — 2016. — May. — Vol. 59, no. 9. — P. 4035—4061.

102. Guiding lead optimization with GPCR structure modeling and molecular dynamics / A. Heifetz, T. James, I. Morao, M. J. Bodkin, P. C. Biggin // Curr. Opin. Pharmacol. — 2016. — Oct. — Vol. 30. — P. 14—21.

103. Buch, I. Complete reconstruction of an enzyme-inhibitor binding process by molecular dynamics simulations / I. Buch, T. Giorgino, G. De Fabritiis // Proc. Natl. Acad. Sci. U. S. A. — 2011. — June. — Vol. 108, no. 25. — P. 10184—10189.

104. Kirkwood, J. G. Statistical Mechanics of Fluid Mixtures / J. G. Kirkwood // J. Chem. Phys. — 1935. — Vol. 3, no. 5. — P. 300—313.

105. Zwanzig, R. W. High-Temperature Equation of State by a Perturbation Method. I. Nonpolar Gases / R. W. Zwanzig // J. Chem. Phys. — 1954. — Aug. — Vol. 22, no. 8.-P. 1420-1426.

106. Brotzakis, Z. F. Accelerating the Calculation of Protein-Ligand Binding Free Energy and Residence Times using Dynamically Optimized Collective Variables / Z. F. Brotzakis, V. Limongelli, M. Parrinello // J. Chem. Theory Comput. — 2018. — Dec.

107. Genheden, S. The MM/PBSA and MM/GBSA methods to estimate ligand-binding affinities/S. Genheden, U. Ryde//Expert Opin. DrugDiscov. —2015. — May. — Vol. 10, no. 5. — P. 449—461.

108. Recent Developments and Applications of the MMPBSA Method / C. Wang, D. Greene, L. Xiao, R. Qi, R. Luo // Front Mol Biosci. — 2018. — Vol. 4. — P. 87.

109. Hansson, T. Ligand binding affinity prediction by linear interaction energy methods / T. Hansson, J. Marelius, J. Aqvist// J. Comput. Aided Mol. Des. — 1998. — Jan. — Vol. 12, no. 1. — P. 27—35.

110. Gutierrez-de-Teran, H. Linear interaction energy: method and applications in drug design / H. Gutierrez-de-Teran, J. Aqvist // Methods Mol. Biol. — 2012. — Vol. 819.-P. 305-323.

111. Predicting Residence Time and Drug Unbinding Pathway through Scaled Molecular Dynamics / D. A. Schuetz, M. Bernetti, M. Bertazzo, D. Musil, H.-M. Eggenweiler, M. Recanatini, M. Masetti, G. F. Ecker, A. Cavalli // J. Chem. Inf. Model. — 2019. — Jan. — Vol. 59, no. 1. — P. 535—549.

112. Genheden, S. Binding affinities of factor Xa inhibitors estimated by thermodynamic integration and MM/GBSA / S. Genheden, I. Nilsson, U. Ryde // J. Chem. Inf. Model. — 2011. — Apr. — Vol. 51, no. 4. — P. 947—958.

113. Construction of 3D-QSAR Models Using the 4D-QSAR Analysis Formalism / A. J. Hopfinger, S. Wang, J. S. Tokarski, B. Jin, M. Albuquerque, P. J. Madhav,

C. Duraiswami // J. Am. Chem. Soc. — 1997. — Oct. — Vol. 119, no. 43. — P. 10509-10524.

114. Mittal, S. Recruiting machine learning methods for molecular simulations of proteins / S. Mittal, D. Shukla // Mol. Simul. — 2018. — July. — Vol. 44, no. 11. — P. 891-904.

115. Ash, J.Characterizing the Chemical Space of ERK2 Kinase Inhibitors Using Descriptors Computed from Molecular Dynamics Trajectories / J. Ash,

D. Fourches // J. Chem. Inf. Model. — 2017. — June. — Vol. 57, no. 6. — P. 1286-1299.

116. Riniker, S. Molecular Dynamics Fingerprints (MDFP): Machine Learning from MD Data To Predict Free-Energy Differences / S. Riniker // J. Chem. Inf. Model. — 2017. — Apr. — Vol. 57, no. 4. — P. 726—741.

117. Machine Learning of Allosteric Effects: The Analysis of Ligand-Induced Dynamics to Predict Functional Effects in TRAP1 / M. Ferraro, E. Moroni, E. Ip-politi, S. Rinaldi, C. Sanchez-Martin, A. Rasola, L. F. Pavarino, G. Colombo // J. Phys. Chem. B. — 2021.— Jan. — Vol. 125, no. 1.—P. 101—114.

118. Machine Learning Prediction of Allosteric Drug Activity from Molecular Dynamics / F. Marchetti, E. Moroni, A. Pandini, G. Colombo // J. Phys. Chem. Lett. — 2021. — Apr. — Vol. 12, no. 15. — P. 3724—3732.

119. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers / M. J. Abraham, T. Murtola, R. Schulz, S. Pall, J. C. Smith, B. Hess, E. Lindahl // SoftwareX. - 2015. - Vol. 1/2. -P. 19-25.

120. Kamp, M. W. van der. Combined Quantum Mechanics/Molecular Mechanics (QM/MM) Methods in Computational Enzymology / M. W. van der Kamp,

A. J. Mulholland//Biochemistry. — 2013. — Vol. 52, no. 16. — P. 2708—2728. — PMID: 23557014.

121. The Amber biomolecular simulation programs / D. A. Case, T. E. Cheatham 3rd, T. Darden, H. Gohlke, R. Luo, K. M. Merz Jr, A. Onufriev, C. Simmerling,

B. Wang, R. J. Woods // J. Comput. Chem. — 2005. — Dec. — Vol. 26, no. 16. — P. 1668-1688.

122. Berendsen, H. J. C. GROMACS: A message-passing parallel molecular dynamics implementation / H. J. C. Berendsen, D. van der Spoel, R. van Drunen // Comput. Phys. Commun. — 1995. — Sept. — Vol. 91, no. 1—3. — P. 43—56.

123. CHARMM: the biomolecular simulation program / B. R. Brooks,

C. L. Brooks 3rd, A. D. Mackerell Jr, L. Nilsson, R. J. Petrella, B. Roux, Y. Won, G. Archontis, C. Bartels, S. Boresch, A. Caflisch, L. Caves, Q. Cui, A. R. Dinner, M. Feig, S. Fischer, J. Gao, M. Hodoscek, W. Im, K. Kuczera, T. Lazaridis, J. Ma, V. Ovchinnikov, E. Paci, R. W. Pastor, C. B. Post, J. Z. Pu, M. Schaefer, B. Tidor, R. M. Venable, H. L. Woodcock, X. Wu, W. Yang,

D. M. York, M. Karplus // J. Comput. Chem. — 2009. — July. — Vol. 30, no. 10.—P. 1545—1614.

124. Jorgensen, W. L. The OPLS [optimized potentials for liquid simulations] potential functions for proteins, energy minimizations for crystals of cyclic peptides and crambin / W. L. Jorgensen, J. Tirado-Rives // J. Am. Chem. Soc. — 1988. — Mar. — Vol. 110, no. 6. — P. 1657—1666.

125. Wallqvist, A. Molecular Models of Water: Derivation and Description: Lip-kowitz/Reviews / A. Wallqvist, R. D. Mountain // Reviews in Computational Chemistry. Vol. 1 / ed. by K. B. Lipkowitz, D. B. Boyd. — Hoboken, NJ, USA : John Wiley & Sons, Inc., 01/1999. —P. 183—247. — (Reviews in Computational Chemistry).

126. Statistical Analysis on the Performance of Molecular Mechanics Poisson-Boltzmann Surface Area versus Absolute Binding Free Energy Calculations: Bromodomains as a Case Study / M. Aldeghi, M. J. Bodkin, S. Knapp, P. C. Biggin // J. Chem. Inf. Model. — 2017. — Sept. — Vol. 57, no. 9. — P. 2203—2221.

127. Accurate and reliable prediction of relative ligand binding potency in prospective drug discovery by way of a modern free-energy calculation protocol and force field / L. Wang, Y. Wu, Y. Deng, B. Kim, L. Pierce, G. Krilov, D. Lupyan, S. Robinson, M. K. Dahlgren, J. Greenwood, D. L. Romero,

C. Masse, J. L. Knight, T. Steinbrecher, T. Beuming, W. Damm, E. Harder, W. Sherman, M. Brewer, R. Wester, M. Murcko, L. Frye, R. Farid, T. Lin,

D. L. Mobley, W. L. Jorgensen, B. J. Berne, R. A. Friesner, R. Abel // J. Am. Chem. Soc. — 2015. — Feb. — Vol. 137, no. 7. — P. 2695—2703.

128. Karplus, M. Molecular dynamics simulations of biomolecules / M. Karplus, J. A. McCammon // Nat. Struct. Biol. — 2002. — Sept. — Vol. 9, no. 9. — P. 646-652.

129. Semianalytical treatment of solvation for molecular mechanics and dynamics / W. C. Still, A. Tempczyk, R. C. Hawley, T. Hendrickson// J. Am. Chem. Soc. — 1990.-Vol. 112, no. 16.-P. 6127-6129.

130. Semianalytical treatment of solvation for molecular mechanics and dynamics / W. C. Still, A. Tempczyk, R. C. Hawley, T. Hendrickson// J. Am. Chem. Soc. — 1990.-Aug.-Vol. 112, no. 16. - P. 6127-6129.

131. Connolly, M. L. Solvent-accessible surfaces of proteins and nucleic acids / M. L. Connolly// Science. — 1983. — Aug. — Vol. 221, no. 4612. — P. 709—713.

132. Assessing the performance of the MM/PBSA and MM/GBSA methods. 1. The accuracy of binding free energy calculations based on molecular dynamics simulations / T. Hou, J. Wang, Y. Li, W. Wang // J. Chem. Inf. Model. — 2011. — Jan. — Vol. 51, no. 1. — P. 69—82.

133. A computational insight into binding modes of inhibitors XD29, XD35, and XD28 to bromodomain-containing protein 4 based on molecular dynamics simulations / J. Su, X. Liu, S. Zhang, F. Yan, Q. Zhang, J. Chen // J. Biomol. Struct. Dyn. — 2018. — Apr. — Vol. 36, no. 5. — P. 1212—1224.

134. Computational search for aflatoxin binding proteins / Y. Wang, J. Liu, L. Zhang, X. He, J. Z. H. Zhang // Chem. Phys. Lett. — 2017. — Oct. — P. 1—8.

135. Characterizing the Hot Spots Involved in RON-MSP^ Complex Formation Using Alanine Scanning Mutagenesis and Molecular Dynamics Simulation /

0. Zarei, M. Hamzeh-Mivehroud, S. Benvenuti, F. Ustun-Alkan, S. Dastmalchi // Adv Pharm Bull. — 2017. — Apr. — Vol. 7, no. 1. — P. 141—150.

136. Sato, R The binding structure and affinity of photodamaged duplex DNA with members of the photolyase/cryptochrome family: A computational study / R. Sato, R. Harada, Y. Shigeta // Biophys Physicobiol. — 2018. — Jan. — Vol. 15.—P. 18—27.

137. Blocking the passage: C60 geometrically clogs K(+) channels / M. Calvaresi, S. Furini, C. Domene, A. Bottoni, F. Zerbetto // ACS Nano. — 2015. — May. — Vol. 9, no. 5. — P. 4827—4834.

138. Ligand affinities predicted with the MM/PBSA method: dependence on the simulation method and the force field / A. Weis, K. Katebzadeh, P. Soderhjelm,

1. Nilsson, U. Ryde // J. Med. Chem. - 2006. - Nov. - Vol. 49, no. 22. -P. 6596-6606.

139. Assessing the performance of the molecular mechanics/Poisson Boltzmann surface area and molecular mechanics/generalized Born surface area methods. II. The accuracy of ranking poses generated from docking / T. Hou, J. Wang, Y. Li, W. Wang // J. Comput. Chem. — 2011. — Apr. — Vol. 32, no. 5. — P. 866—877.

140. Fast and accurate predictions of binding free energies using MM-PBSA and MM-GBSA / G. Rastelli, A. Del Rio, G. Degliesposti, M. Sgobba // J. Comput. Chem. — 2010. — Mar. — Vol. 31, no. 4. — P. 797—810.

141. Assessing the performance of MM/PBSA and MM/GBSA methods. 5. Improved docking performance using high solute dielectric constant MM/GBSA and MM/PBSA rescoring / H. Sun, Y. Li, M. Shen, S. Tian, L. Xu, P. Pan, Y. Guan, T. Hou // Phys. Chem. Chem. Phys. — 2014. — Oct. — Vol. 16, no. 40. — P. 22035—22045.

142. Genheden, S. Will molecular dynamics simulations of proteins ever reach equilibrium? / S. Genheden, U. Ryde // Phys. Chem. Chem. Phys. — 2012. — June. — Vol. 14, no. 24. — P. 8662—8677.

143. g_mmpbsa-a GROMACS tool for high-throughput MM-PBSA calculations / R. Kumari, R. Kumar, Open Source Drug Discovery Consortium, A. Lynn // J. Chem. Inf. Model. — 2014. — July. — Vol. 54, no. 7. — P. 1951—1962.

144. Electrostatics of nanosystems: application to microtubules and the ribosome / N. A. Baker, D. Sept, S. Joseph, M. J. Holst, J. A. McCammon // Proc. Natl. Acad. Sci. U. S. A. - 2001. - Aug. - Vol. 98, no. 18. - P. 10037-10041.

145. Paradoxically, Most Flexible Ligand Binds Most Entropy-Favored: Intriguing Impact of Ligand Flexibility and Solvation on Drug-Kinase Binding / B. Wienen-Schmidt, H. R. A. Jonker, T. Wulsdorf, H.-D. Gerber, K. Saxena, D. Kudlinzki, S. Sreeramulu, G. Parigi, C. Luchinat, A. Heine, H. Schwalbe, G. Klebe // J. Med. Chem. — 2018. — July.

146. Efficient Approximation of Ligand Rotational and Translational Entropy Changes upon Binding for Use in MM-PBSA Calculations /1. Y. Ben-Shalom, S. Pfeiffer-Marek, K.-H. Baringhaus, H. Gohlke // J. Chem. Inf. Model. — 2017. — Feb. — Vol. 57, no. 2. — P. 170—189.

147. Duan, L. Interaction Entropy: A New Paradigm for Highly Efficient and Reliable Computation of Protein-Ligand Binding Free Energy / L. Duan, X. Liu, J. Z. H. Zhang // J. Am. Chem. Soc. — 2016. — May. — Vol. 138, no. 17. — P. 5722—5728.

148. Trypsin-Ligand binding affinities calculated using an effective interaction entropy method under polarized force field / Y. Cong, M. Li, G. Feng, Y. Li, X. Wang, L. Duan // Sci. Rep. - 2017. - Dec. - Vol. 7, no. 1. - P. 17708.

149. Guimaraes, C. R. W. MM-GB/SA rescoring of docking poses in structure-based lead optimization / C. R. W. Guimaraes, M. Cardozo // J. Chem. Inf. Model. — 2008. — May. — Vol. 48, no. 5. — P. 958—970.

150. Ripphausen, P. REPROVIS-DB: a benchmark system for ligand-based virtual screening derived from reproducible prospective applications / P. Ripphausen,

A. M. Wassermann, J. Bajorath // J. Chem. Inf. Model. — 2011. — Oct. — Vol. 51, no. 10.—P. 2467—2473.

151. Kearnes, S. Pursuing a prospective perspective / S. Kearnes // Trends in Chemistry. — 2021. — Feb. — Vol. 3, no. 2. — P. 77—79.

152. D3R Grand Challenge 3: blind prediction of protein-ligand poses and affinity rankings / Z. Gaieb, C. D. Parks, M. Chiu, H. Yang, C. Shao, W. P. Walters, M. H. Lambert, N. Nevins, S. D. Bembenek, M. K. Ameriks, T. Mirzadegan, S. K. Burley, R. E. Amaro,M. K. Gilson//J. Comput. Aided Mol. Des. — 2019. — Jan.— Vol. 33, no. 1.—P. 1—18.

153. Merck Molecular Activity Challenge. — 2012. — URL: https://www.kaggle. com/c/MerckActivity/ (дата обр. 05.02.2022).

154. Riniker, S. Open-source platform to benchmark fingerprints for ligand-based virtual screening / S. Riniker, G. A. Landrum // J. Cheminform. — 2013. — May. — Vol. 5, no. 1.—P. 26.

155. Decoys Selection in Benchmarking Datasets: Overview and Perspectives / M. Réau, F. Langenfeld, J.-F. Zagury, N. Lagarde, M. Montes // Front. Pharmacol. — 2018. — Jan. — Vol. 9.—P. 11.

156. Bissantz, C. Protein-Based Virtual Screening of Chemical Databases. 1. Evaluation of Different Docking/Scoring Combinations / C. Bissantz, G. Folkers, D. Rognan. — 2000.

157. McGovern, S. L. Information decay in molecular docking screens against holo, apo, and modeled conformations of enzymes / S. L. McGovern, B. K. Shoichet // J. Med. Chem. — 2003. — July. — Vol. 46, no. 14. — P. 2895—2907.

158. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings / C. A. Lipinski, F. Lombardo,

B. W. Dominy, P. J. Feeney // Adv. Drug Deliv. Rev. — 2001. — Mar. — Vol. 46, no. 1—3.—P. 3—26.

159. Virtual screening using protein-ligand docking: avoiding artificial enrichment / M. L. Verdonk, V. Berdini, M. J. Hartshorn, W. T. M. Mooij, C. W. Murray, R. D. Taylor, P. Watson // J. Chem. Inf. Comput. Sci. — 2004. — May. — Vol. 44, no. 3.—P. 793—806.

160. Huang, ^.Benchmarking sets for molecular docking / N. Huang, B. K. Shoichet, J. J. Irwin//J. Med. Chem. — 2006. — Nov. — Vol. 49, no. 23. — P. 6789—6801.

161. Good, A. C. Optimization of CAMD techniques 3. Virtual screening enrichment studies: a help or hindrance in tool selection? / A. C. Good, T. I. Oprea // J. Comput. Aided Mol. Des. — 2008. — Mar. — Vol. 22, no. 3/4. — P. 169—178.

162. How to do an evaluation: pitfalls and traps / P. C. D. Hawkins, G. L. Warren, A. Geoffrey Skillman, A. Nicholls. — 2008.

163. Directory of useful decoys, enhanced (DUD-E): better ligands and decoys for better benchmarking / M. M. Mysinger, M. Carchia, J. J. Irwin, B. K. Shoichet // J. Med. Chem. — 2012. — July. — Vol. 55, no. 14. — P. 6582—6594.

164. The ChEMBL database in 2017 / A. Gaulton, A. Hersey, M. Nowotka, A. P. Bento, J. Chambers, D. Mendez, P. Mutowo, F. Atkinson, L. J. Bel-lis, E. Cibrian-Uhalte, M. Davies, N. Dedman, A. Karlsson, M. P. Magarinos, J. P. Overington, G. Papadatos, I. Smit, A. R. Leach // Nucleic Acids Res. — 2017. — Jan. — Vol. 45, no. D1. — P. D945—D954.

165. Evaluation and optimization of virtual screening workflows with DEKOIS 2.0-a public library of challenging docking benchmark sets / M. R. Bauer, T. M. Ibrahim, S. M. Vogel, F. M. Boeckler // J. Chem. Inf. Model. — 2013. — June. — Vol. 53, no. 6. — P. 1447—1462.

166. Vogel, S. M. DEKOIS: demanding evaluation kits for objective in silico screening-a versatile tool for benchmarking docking programs and scoring functions / S. M. Vogel, M. R. Bauer, F. M. Boeckler // J. Chem. Inf. Model. — 2011. —Oct.— Vol. 51, no. 10. —P. 2650—2665.

167. Rohrer, S. G. Maximum unbiased validation (MUV) data sets for virtual screening based on PubChem bioactivity data / S. G. Rohrer, K. Baumann // J. Chem. Inf. Model. — 2009. — Feb. — Vol. 49, no. 2. — P. 169—184.

168. Pubchem database. — URL: https: //pubchem. ncbi. nlm. nih. gov (дата обр. 05.02.2022).

169. Baell, J. B. New substructure filters for removal of pan assay interference compounds (PAINS) from screening libraries and for their exclusion in bioassays / J. B. Baell, G. A. Holloway // J. Med. Chem. — 2010. — Apr. — Vol. 53, no. 7. — P. 2719—2740.

170. Wallach, I. Most Ligand-Based Classification Benchmarks Reward Memorization Rather than Generalization /1. Wallach, A. Heifets // J. Chem. Inf. Model. — 2018. — May. — Vol. 58, no. 5. — P. 916—932.

171. Willems, H. Computational Chemistry on a Budget: Supporting Drug Discovery with Limited Resources / H. Willems, S. De Cesco, F. Svensson // J. Med. Chem. - 2020. - Sept. - Vol. 63, no. 18.-P. 10158-10169.

172. Rogers, D. Extended-connectivity fingerprints / D. Rogers, M. Hahn // J. Chem. Inf. Model. — 2010. — May. — Vol. 50, no. 5. — P. 742—754.

173. Selecting, Acquiring, and Using Small Molecule Libraries for High-Throughput Screening / S. Dandapani, G. Rosse, N. Southall, J. M. Salvino, C. J. Thomas // Curr. Protoc. Chem. Biol. — 2012. — Sept. — Vol. 4. — P. 177—191.

174. Sundar, V. The Effect of Debiasing Protein-Ligand Binding Data on Generalization / V. Sundar, L. Colwell // J. Chem. Inf. Model. - 2020. - Jan. - Vol. 60, no. 1.—P. 56—62.

175. Bender, A. A discussion of measures of enrichment in virtual screening: comparing the information content of descriptors with increasing levels of sophistication / A. Bender, R. C. Glen // J. Chem. Inf. Model. - 2005. - Sept. - Vol. 45, no. 5.—P. 1369—1375.

176. Nicholls, A. Confidence limits, error bars and method comparison in molecular modeling. Part 1: the calculation of confidence intervals / A. Nicholls // J. Comput. Aided Mol. Des. — 2014. — Sept. — Vol. 28, no. 9. — P. 887—918.

177. Nicholls, A. Confidence limits, error bars and method comparison in molecular modeling. Part 2: comparing methods / A. Nicholls // J. Comput. Aided Mol. Des. — 2016. — Feb. — Vol. 30, no. 2. — P. 103—126.

178. Rethinking drug design in the artificial intelligence era / P. Schneider, W. P. Walters, A. T. Plowright, N. Sieroka, J. Listgarten, R. A. Goodnow Jr, J. Fisher, J. M. Jansen, J. S. Duca, T. S. Rush, M. Zentgraf, J. E. Hill, E. Krutoholow, M. Kohler, J. Blaney, K. Funatsu, C. Luebkemann, G. Schneider // Nat. Rev. Drug Discov. — 2020. — May. — Vol. 19, no. 5. — P. 353—364.

179. Brown, S. P. Healthy skepticism: assessing realistic model performance / S. P. Brown, S. W. Muchmore, P. J. Hajduk // Drug Discov. Today. — 2009. — Apr — Vol. 14, no. 7/8. — P. 420—427.

180. Structure of the catalytic domain of human phosphodiesterase 5 with bound drug molecules / B.-J. Sung, K. Y. Hwang, Y. H. Jeon, J. I. Lee, Y.-S. Heo, J. H. Kim, J. Moon, J. M. Yoon, Y.-L. Hyun, E. Kim, S. J. Eum, S.-Y. Park, J.-O. Lee, T. G. Lee, S. Ro, J. M. Cho // Nature. - 2003. - Sept. - Vol. 425, no. 6953. -P. 98-102.

181. Comparative assessment of scoring functions on an updated benchmark: 2. Evaluation methods and general results / Y. Li, L. Han, Z. Liu, R. Wang // J. Chem. Inf. Model. — 2014. — June. — Vol. 54, no. 6. — P. 1717—1736.

182. Machine Learning Classification Models to Improve the Docking-based Screening: A Case of PI3K-Tankyrase Inhibitors / V. P. Berishvili, A. E. Voronkov, E. V. Radchenko, V. A. Palyulin // Molecular Informatics. — 2018. — Vol. 37, no. 11. — e1800030.

183. Tankyrase Inhibition Blocks Wnt/|3-Catenin Pathway and Reverts Resistance to PI3K and AKT Inhibitors in the Treatment of Colorectal Cancer / O. Arqués, I. Chicote, I. Puig, S. P. Tenbaum, G. Argilés, R. Dienstmann, N. Fernández, G. Caratù, J. Matito, D. Silberschmidt, J. Rodon, S. Landolfi, A. Prat, E. Espin, R. Charco, P. Nuciforo, A. Vivancos, W. Shao, J. Tabernero, H. G. Palmer // Clin. Cancer Res. — 2016. — Feb. — Vol. 22, no. 3. — P. 644—656.

184. Prognostic Role of PD-L1 Expression in Renal Cell Carcinoma. A Systematic Review and Meta-Analysis / R. Iacovelli, F. Nolè, E. Verri, G. Renne, C. Paglino, M. Santoni, M. C. Rocca, P. Giglione, G. Aurilio, D. Cullurà, S. Cascinu, C. Porta // Target. Oncol. — 2015. — Vol. 11, no. 2. — P. 143—148.

185. Mutations in PI3K/AKT pathway genes and amplifications of PIK3CA are associated with patterns of recurrence in gastric cancers / W.-L. Fang, K.-H. Huang, Y.-T. Lan, C.-H. Lin, S.-C. Chang, M.-H. Chen, Y. Chao, W.-C. Lin, S.-S. Lo, A. F.-Y. Li, C.-W. Wu, S.-H. Chiou, Y.-M. Shyr// Oncotarget. - 2016. - Feb. -Vol. 7, no. 5. — P. 6201—6220.

186. Yu, M. Discovering new PI3Ka inhibitors with a strategy of combining ligand-based and structure-based virtual screening / M. Yu, Q. Gu, J. Xu // J. Comput. Aided Mol. Des. — 2018. — Feb. — Vol. 32, no. 2. — P. 347—361.

187. Synthesis and biological evaluation of sulfonamide analogues of the phos-phatidylinositol 3-kinase inhibitor ZSTK474 / S. A. Gamage, A. C. Giddens, K. Y. Tsang, J. U. Flanagan, J. D. Kendall, W.-J. Lee, B. C. Baguley, C. M. Buchanan, S. M. F. Jamieson, P. R. Shepherd, W. A. Denny, G. W. Rew-castle//Bioorg. Med. Chem. — 2017. — Oct. — Vol. 25, no. 20. — P. 5859—5874.

188. MSK1-Mediated (-Catenin Phosphorylation Confers Resistance to PI3K/mTOR Inhibitors in Glioblastoma / S. Wu, S. Wang, S. Zheng, R. Verhaak, D. Koul, W. K. A. Yung // Mol. Cancer Ther. — 2016. — July. — Vol. 15, no. 7. — P. 1656-1668.

189. Stamos, J. L. The beta-Catenin Destruction Complex / J. L. Stamos, W. I. Weis // Cold Spring Harb. Perspect. Biol. — 2012. — Vol. 5, no. 1. — a007898—a007898.

190. IWR-1, a tankyrase inhibitor, attenuates Wnt/(-catenin signaling in cancer stem-like cells and inhibits in vivo the growth of a subcutaneous human osteosar-coma xenograft / S. R. Martins-Neves, D. I. Paiva-Oliveira, C. Fontes-Ribeiro, J. V. M. G. Bovee, A.-M. Cleton-Jansen, C. M. F. Gomes // Cancer Lett. — 2018. - Feb. - Vol. 414. - P. 1-15.

191. Tankyrase inhibitors suppress hepatocellular carcinoma cell growth via modulating the Hippo cascade / J. Jia, Y. Qiao, M. G. Pilo, A. Cigliano, X. Liu, Z. Shao, D. F. Calvisi, X. Chen // PLoS One. - 2017. - Sept. - Vol. 12, no. 9. -e0184068.

192. TANKYRASE Inhibition Enhances the Antiproliferative Effect of PI3K and EGFR Inhibition, Mutually Affecting (-CATENIN and AKT Signaling in Colorectal Cancer / N. T. Solberg, J. Waaler, K. Lund, L. Mygland, P. A. Olsen, S. Krauss // Mol. Cancer Res. — 2018. — Mar. — Vol. 16, no. 3. — P. 543—553.

193. Katoh, M. Molecular genetics and targeted therapy of WNT-related human diseases (Review) / M. Katoh, M. Katoh // Int. J. Mol. Med. — 2017. — Sept. — Vol. 40, no. 3. — P. 587—606.

194. Identification of diverse database subsets using property-based and fragment-based molecular descriptions / M. Ashton, J. Barnard, F. Casset, M. Charlton, G. Downs, D. Gorse, J. Holliday, R. Lahana, P. Willett // Quant. struct.-act. re-latsh. — 2002. — Dec. — Vol. 21, no. 6. — P. 598—604.

195. Pagadala, N. S. Software for molecular docking: a review / N. S. Pagadala, K. Syed, J. Tuszynski // Biophys. Rev. — 2017. — Apr. — Vol. 9, no. 2. — P. 91-102.

196. Koes, D. R. Lessons learned in empirical scoring with smina from the CSAR 2011 benchmarking exercise / D. R. Koes, M. P. Baumgartner, C. J. Camacho // J. Chem. Inf. Model. — 2013. — Aug. — Vol. 53, no. 8. — P. 1893—1904.

197. Motta, S. Modeling Binding with Large Conformational Changes: Key Points in Ensemble-Docking Approaches / S. Motta, L. Bonati // J. Chem. Inf. Model. — 2017. — July. — Vol. 57, no. 7. — P. 1563—1578.

198. Sheridan, R. P. Time-split cross-validation as a method for estimating the goodness of prospective prediction / R. P. Sheridan // J. Chem. Inf. Model. — 2013. — Apr. — Vol. 53, no. 4. — P. 783—790.

199. Kumar, A. Shape similarity guided pose prediction: lessons from D3R Grand Challenge 3 / A. Kumar, K. Y. J. Zhang // J. Comput. Aided Mol. Des. — 2018. — Aug.

200. Improvements to the APBS biomolecular solvation software suite / E. Jurrus, D. Engel, K. Star, K. Monson, J. Brandi, L. E. Felberg, D. H. Brookes, L. Wilson, J. Chen, K. Liles, M. Chun, P. Li, D. W. Gohara, T. Dolinsky, R. Konecny, D. R. Koes, J. E. Nielsen, T. Head-Gordon, W. Geng, R. Krasny, G.-W. Wei, M. J. Holst, J. A. McCammon, N. A. Baker // Protein Science. — 2017. — Oct. — Vol. 27, no. 1.-P. 112-128.

201. Discovery of novel tankyrase inhibitors through molecular docking-based virtual screening and molecular dynamics simulation studies / V. P. Berishvili, A. N. Kuimov, A. E. Voronkov, E. V. Radchenko, P. Kumar, Y. E. Choonara, V. Pillay, A. Kamal, V. A. Palyulin // Molecules. — 2020. — Vol. 25, no. 14. — P. 3171.

202. rd_filters. — URL: https : / / github . com / PatWalters / rd_ filters (дата обр. 05.02.2022).

203. RDkit. — URL: http://www.rdkit.org (дата обр. 05.02.2022).

204. Computer-aided estimation of the hERG-mediated cardiotoxicity risk of potential drug components / E. V. Radchenko, Y. A. Rulev, A. Y. Safanyaev, V. A. Palyulin, N. S. Zefirov // Dokl. Biochem. Biophys. — 2017. — Mar. — Vol. 473, no. 1.-P. 128-131.

205. Prediction of human intestinal absorption of drug compounds / E. V. Radchenko, A. S. Dyabina, V. A. Palyulin, N. S. Zefirov // Russ. Chem. Bull. — 2016. — Feb. — Vol. 65, no. 2. — P. 576—580.

206. Machine Learning Classification Models to Improve the Docking-based Screening: A Case of PI3K-Tankyrase Inhibitors / V. P. Berishvili, A. E. Voronkov, E. V. Radchenko, V. A. Palyulin // Mol. Inform. — 2018. — Nov. — Vol. 37, no. 11. — e1800030.

207. Cheron, ^.Effect of sampling on BACE-1 ligands binding free energy predictions via MM-PBSA calculations / N. Cheron, E. I. Shakhnovich //J. Comput. Chem. -2017. - Aug. - Vol. 38, no. 22. - P. 1941-1951.

208. Time-Domain Analysis of Molecular Dynamics Trajectories Using Deep Neural Networks: Application to Activity Ranking of Tankyrase Inhibitors / V. P. Berishvili, V. O. Perkin, A. E. Voronkov, E. V. Radchenko, R. Syed, C. Venkata Ramana Reddy, V. Pillay, P. Kumar, Y. E. Choonara, A. Kamal, V. A. Palyulin // J. Chem. Inf. Model. — 2019. — Aug. — Vol. 59, no. 8. — P. 3519—3532.

209. XGboost. — URL: https://xgboost.ai (дата обр. 05.02.2022).

210. Relative Binding Free Energy Calculations Applied to Protein Homology Models / D. Cappel, M. L. Hall, E. B. Lenselink, T. Beuming, J. Qi, J. Bradner, W. Sherman // J. Chem. Inf. Model. — 2016. — Dec. — Vol. 56, no. 12. — P. 2388-2400.

211. Impact of Different Automated Binding Pose Generation Approaches on Relative Binding Free Energy Simulations / D. Cappel, S. Jerome, G. Hessler, H. Matter // J. Chem. Inf. Model. — 2020. — Mar. — Vol. 60, no. 3. — P. 1432-1444.

212. Development of novel dual binders as potent, selective, and orally bioavail-able tankyrase inhibitors / Z. Hua, H. Bregman, J. L. Buchanan, N. Chakka, A. Guzman-Perez, H. Gunaydin, X. Huang, Y. Gu, V. Berry, J. Liu, Y. Tef-fera, L. Huang, B. Egge, R. Emkey, E. L. Mullady, S. Schneider, P. S. Andrews, L. Acquaviva, J. Dovey, A. Mishra, J. Newcomb, D. Saffran, R. Serafino, C. A. Strathdee, S. M. Turci, M. Stanton, C. Wilson, E. F. Dimauro // J. Med. Chem. — 2013. — Dec. — Vol. 56, no. 24. — P. 10003—10015.

213. A Survey of the Role of Noncovalent Sulfur Interactions in Drug Design / B. R. Beno, K.-S. Yeung, M. D. Bartberger, L. D. Pennington, N. A. Meanwell // J. Med. Chem. — 2015. — June. — Vol. 58, no. 11. — P. 4383—4438.

214. Lead optimization mapper: automating free energy calculations for lead optimization / S. Liu, Y. Wu, T. Lin, R. Abel, J. P. Redmann, C. M. Summa, V. R. Jaber, N. M. Lim, D. L. Mobley // J. Comput. Aided Mol. Des. — 2013. — Sept. - Vol. 27, no. 9. - P. 755-770.

215. Time-domain analysis of molecular dynamics trajectories using deep neural networks: Application to activity ranking of tankyrase inhibitors / V. P. Berishvili, V. O. Perkin, A. E. Voronkov, E. V. Radchenko, R. Syed, C. Venkata Ramana Reddy, V. Pillay, P. Kumar, Y. E. Choonara, A. Kamal, V. A. Palyulin // Journal of Chemical Information and Modeling. — 2019. — Vol. 59, no. 8. — P. 3519—3532.

216. Wingert, B. M. Optimal affinity ranking for automated virtual screening validated in prospective D3R grand challenges / B. M. Wingert, R. Oerlemans, C. J. Camacho // J. Comput. Aided Mol. Des. — 2018. — Jan. — Vol. 32, no. 1. — P. 287—297.

217. Recognizing pitfalls in virtual screening: a critical review / T. Scior, A. Bender, G. Tresadern, J. L. Medina-Franco, K. Martinez-Mayorga, T. Langer, K. Cuanalo-Contreras, D. K. Agrafiotis // J. Chem. Inf. Model. — 2012. — Apr. — Vol. 52, no. 4.—P. 867—881.

218. D3R Grand Challenge 2: blind prediction of protein-ligand poses, affinity rankings, and relative binding free energies / Z. Gaieb, S. Liu, S. Gathiaka, M. Chiu, H. Yang, C. Shao, V. A. Feher, W. P. Walters, B. Kuhn, M. G. Rudolph, S. K. Burley, M. K. Gilson, R. E. Amaro // J. Comput. Aided Mol. Des. — 2018. — Jan. — Vol. 32, no. 1. — P. 1—20.

219. D3R grand challenge 2015: Evaluation of protein-ligand pose and affinity predictions / S. Gathiaka, S. Liu, M. Chiu, H. Yang, J. A. Stuckey, Y. N. Kang, J. Delproposto, G. Kubish, J. B. Dunbar Jr, H. A. Carlson, S. K. Burley, W. P. Walters, R. E. Amaro, V. A. Feher, M. K. Gilson // J. Comput. Aided Mol. Des. — 2016. — Sept. — Vol. 30, no. 9. — P. 651—668.

220. Conditional variable importance for random forests / C. Strobl, A.-L. Boulesteix, T. Kneib, T. Augustin, A. Zeileis // BMC Bioinformatics. — 2008. — July. — Vol. 9. — P. 307.

221. Ellingson, S. R. Machine learning and ligand binding predictions: A review of data, methods, and obstacles / S. R. Ellingson, B. Davis, J. Allen. — 2020.

222. The PDBbind database: methodologies and updates / R. Wang, X. Fang, Y. Lu, C.-Y. Yang, S. Wang // J. Med. Chem. - 2005. - June. - Vol. 48, no. 12. -P. 4111-4119.

223. Rational Design of Particle Mesh Ewald Compatible Lennard-Jones Parameters for +2 Metal Cations in Explicit Solvent / P. Li, B. P. Roberts, D. K. Chakravorty, K. M. Merz Jr // J. Chem. Theory Comput. — 2013. — June. — Vol. 9, no. 6. — P. 2733—2748.

224. Charge group partitioning in biomolecular simulation / S. Canzar, M. El-Kebir, R. Pool, K. Elbassioni, A. E. Mark, D. P. Geerke, L. Stougie, G. W. Klau // J. Comput. Biol. — 2013. — Mar. — Vol. 20, no. 3. — P. 188—198.

225. DataWarrior: an open-source program for chemistry aware data visualization and analysis / T. Sander, J. Freyss, M. vonKorff, C. Rufener// J. Chem. Inf. Model. — 2015. — Feb. — Vol. 55, no. 2. — P. 460—473.

226. Cooke, B. Statistical prediction and molecular dynamics simulation / B. Cooke, S. C. Schmidler // Biophys. J. - 2008. - Nov. - Vol. 95, no. 10. -

P. 4497—4511.

227. Duan, L. L. Large-scale molecular dynamics simulation: Effect of polarization on thrombin-ligand binding energy / L. L. Duan, G. Q. Feng, Q. G. Zhang // Sci. Rep.— 2016.—Aug.—Vol. 6.—P. 31488.

228. García-Sosa, A. T. Including tightly-bound water molecules in de novo drug design. Exemplification through the in silico generation of poly(ADP-ribose)polymerase ligands / A. T. García-Sosa, S. Firth-Clark, R. L. Mancera // J. Chem. Inf. Model. — 2005. — May. — Vol. 45, no. 3. — P. 624—633.

229. Michel, J. Prediction of the Water Content in Protein Binding Sites / J. Michel, J. Tirado-Rives, W. L. Jorgensen. — 2009.

230. Lemmon, G. Towards ligand docking including explicit interface water molecules / G. Lemmon, J. Meiler // PLoS One. — 2013. — June. — Vol. 8, no. 6. — e67536.

231. Forli, S. A force field with discrete displaceable waters and desolvation entropy for hydrated ligand docking / S. Forli, A. J. Olson // J. Med. Chem. — 2012. — Jan. — Vol. 55, no. 2. — P. 623—638.

232. Gaillard, T. Evaluation of AutoDock and AutoDock Vina on the CASF-2013 Benchmark / T. Gaillard // J. Chem. Inf. Model. — 2018. — Aug. — Vol. 58, no. 8.—P. 1697—1706.

233. Comparability of Mixed IC50 Data - A Statistical Analysis / T. Kalliokoski, C. Kramer, A. Vulpetti, P. Gedeck. — 2013.

234. Calculating protein-ligand binding affinities with MMPBSA: Method and error analysis / C. Wang, P. H. Nguyen, K. Pham, D. Huynh, T.-B. N. Le, H. Wang, P. Ren, R. Luo // J. Comput. Chem. — 2016. — Oct. — Vol. 37, no. 27. — P. 2436-2446.

235. Miller, /.Stable Recurrent Models / J. Miller, M. Hardt. — 2019. — arXiv: 1805. 10369.

236. ToxAlerts: a Web server of structural alerts for toxic chemicals and compounds with potential adverse reactions /1. Sushko, E. Salmina, V. A. Potemkin, G. Poda, I. V. Tetko // J. Chem. Inf. Model. — 2012. — Aug. — Vol. 52, no. 8. — P. 2310-2316.

237. UFF, a full periodic table force field for molecular mechanics and molecular dynamics simulations / A. K. Rappe, C. J. Casewit, K. S. Colwell, W. A. Goddard, W.M. Skiff//J. Am. Chem. Soc. - 1992.-Vol. 114, no. 25.-P. 10024-10035.

238. Online chemical modeling environment (OCHEM): web platform for data storage, model development and publishing of chemical information / I. Sushko, A. K. Pandey, S. Novotarskyi, R. Körner, M. Rupp, W. Teetz, S. Brandmaier, A. Abdelaziz, V. V. Prokopenko, V. Y. Tanchuk, R. Todeschini, A. Varnek, G. Marcou, P. Ertl, V. Potemkin, M. Grishina, J. Gasteiger, I. I. Baskin, V. A. Palyulin, E. V. Radchenko, W. J. Welsh, V. Kholodovych, D. Chekmarev, A. Cherkasov, J. Aires-de-Sousa, Q.-Y. Zhang, A. Bender, F. Nigsch, L. Patiny, A. Williams, V. Tkachenko, I. V. Tetko. — 2011.

239. Prediction of blood-brain barrier permeability of organic compounds / A. S. Dyabina, E. V. Radchenko, V. A. Palyulin, N. S. Zefirov // Dokl. Biochem. Biophys. — 2016. — Sept. — Vol. 470, no. 1. — P. 371—374.

240. ADMET Prediction Service. — URL: http://qsar.chem.msu.ru/admet/ (дата обр. 05.02.2022).

241. Quiroga, R. Vinardo: A Scoring Function Based on Autodock Vina Improves Scoring, Docking, and Virtual Screening / R. Quiroga, M. A. Villarreal // PLoS One.— 2016.—May.—Vol. 11, no. 5. — e0155183.

242. PDB. — URL: http://www.rcsb.org/ (дата обр. 05.02.2022).

243. UCSF Chimera-a visualization system for exploratory research and analysis / E. F. Pettersen, T. D. Goddard, C. C. Huang, G. S. Couch, D. M. Greenblatt, E. C. Meng, T. E. Ferrin// J. Comput. Chem. — 2004. — Oct. — Vol. 25, no. 13. — P. 1605-1612.

244. Clustal W and Clustal X version2.0 /M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I. M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson, D. G. Higgins // Bioinformatics. — 2007. — Nov. — Vol. 23, no. 21. — P. 2947—2948.

245. Sali, A. Comparative protein modelling by satisfaction of spatial restraints /

A. Sali, T. L. Blundell // J. Mol. Biol. — 1993. — Dec. — Vol. 234, no. 3. — P. 779—815.

246. Webb, B. Comparative Protein Structure Modeling Using MODELLER /

B. Webb, A. Sali // Curr. Protoc. Bioinformatics. — 2016. — June. — Vol. 54. — P. 5.6.1—5.6.37.

247. Shen, M.-Y. Statistical potential for assessment and prediction of protein structures / M.-Y. Shen, A. Sali // Protein Sci. — 2006. — Nov. — Vol. 15, no. 11. — P. 2507—2524.

248. Dunbrack Jr, R. L. Backbone-dependent rotamer library for proteins. Application to side-chain prediction / R. L. Dunbrack Jr, M. Karplus // J. Mol. Biol. — 1993. — Mar. — Vol. 230, no. 2. — P. 543—574.

249. Aldeghi, M. Absolute Alchemical Free Energy Calculations for Ligand Binding: A Beginner's Guide / M. Aldeghi, J. P. Bluck, P. C. Biggin. — 2018.

250. Shirts, M. R. Statistically optimal analysis of samples from multiple equilibrium states / M. R. Shirts, J. D. Chodera. — 2008.

251. Klimovich, P. V. Guidelines for the analysis of free energy calculations / P. V. Klimovich, M. R. Shirts, D. L. Mobley // J. Comput. Aided Mol. Des. — 2015. — May. — Vol. 29, no. 5. — P. 397—411.

252. Absolute Binding Free Energies: A Quantitative Approach for Their Calculation / S. Boresch, F. Tettinger, M. Leitgeb, M. Karplus. — 2003.

253. Michel, J. Prediction of protein-ligand binding affinity by free energy simulations: assumptions, pitfalls and expectations / J. Michel, J. W. Essex// J. Comput. Aided Mol. Des. — 2010. — Aug. — Vol. 24, no. 8. — P. 639—658.

254. BioSimSpace: An interoperable Python framework for biomolecular simulation / L. Hedges, A. Mey, C. Laughton, F. Gervasio, A. Mulholland, C. Woods, J. Michel // J. Open Source Softw. - 2019. - Nov. - Vol. 4, no. 43. - P. 1831.

255. Machine learning for neuroimaging with scikit-learn/ A. Abraham, F. Pedregosa, M. Eickenberg, P. Gervais, A. Mueller, J. Kossaifi, A. Gramfort, B. Thirion, G. Varoquaux // Front. Neuroinform. — 2014. — Feb. — Vol. 8. — P. 14.

256. Kim, Y. Convolutional Neural Networks for Sentence Classification / Y. Kim. — 2014.

257. Schneider, C. A. NIH Image to ImageJ: 25 years of image analysis / C. A. Schneider, W. S. Rasband, K. W. Eliceiri // Nat. Methods. - 2012. - July. - Vol. 9, no. 7.—P. 671—675.

258. Sebaugh, J. L. Guidelines for accurate EC50/IC50 estimation / J. L. Sebaugh // Pharm. Stat. — 2011. — Mar. — Vol. 10, no. 2. — P. 128—134.

Приложение А

Химические структуры соединений, не показавших биологическую

активность

Таблица 18 — Соединения, не показавшие значимого ингибирования танкиразы.

ID

соединения

Структура в формате SMILES

A2 COc(cc1)cc2c1[nH]cc2CCN(C=Cc1c2cnc3nc(-c4ccccc4)nn13)C2=O

A7 COC(C(C(C1=C2)=NNC1=O)=CN2c(cc1)ccc1C1=COc(cc(cc2)O)c2C1=O)=O

A5 COCc1nc(-c2cccc(NC(c3cc(Nc4ncccn4)ccc3)=O)c2)n[nH]1

A4 COc1noc(CCC(Nc2n[nH]c(CCCc3c[nH]c4c3cccc4)n2)=O)c1

A6 Cn1ncc(-c2c3oc(cc(cc4)O)c4c3nc3c2cn[nH]3)c1

G610-0240 O=C(CN(CC1)CCC1(NC1=O)N=C1c(cc1)ccc1Br)Nc(cc1)cc(Cl)c1F

F443-0549 O=C(c(cc1)ccc1N(C(C=C1)=O)N=C1OCc1cc(F)ccc1)Nc1cccc(Cl)c1

F443-0542 COc1cccc(NC(c(cc2)ccc2N(C(C=C2)=O)N=C2OCc2cccc(F)c2)=O)c1

F471-0090 CCCN(C(N1c2c3ccc(C(NC4CCCC4)=O)c2)=NN(Cc(cc2)ccc2F)C1=O)C3=O

D753-0107 O=C(Cn(cc1)c2c1ccc(F)c2)N[C@H]1CC[C@H](CN(Cc2c3cccc2)C3=O)CC1

Y043-0404 CC(C)c1cc(C(NC(CSCC(Nc(cc(cc2)Cl)c2O)=O)=N2)=O)c2s1

E543-0914 Cc(cc1)ccc1-c1c(NC(c(cc2)c-3cc2C(NCCc2cccs2)=O)=O)n3nn1

D392-0100 Cc1ccc(CSC(N2)=NC(NC(C[C@@H]3c(cc4)cc(Br)c4F)=O)=C3C2=O)cc1

E543-0481 O=C(c(cc1)cc(-n2nnc(-c(cc3)ccc3F)c2N2)c1C2=O)NC1CCCCC1

D385-0404 CCC(CC)(Cc1c2cccc1)C1=C2N=C(CSC(N2)=Nc(cccc3)c3C2=O)NC1=O

продолжение следует

(окончание)

ID

соединения

Структура в формате SMILES

SC87-1235 CC(C)C(NC[C@@H](CC1)CCC(N=C(c(cc2)ccc2F)N2)=C1C2=O)=O

SB25-0473 O=C([C@@H](CC1)CCC(N=C(c2ccccc2)N2)=C1C2=O)NCc1cscc1

G542-0991 O=C(c1nn(CCCN(Cc(cc2)ccc2F)C2=O)c2c1)NCCc(cccc1)c1Cl

D058-0126 CC(N=C(N1)SCC(Nc2cc(OC)ccc2)=O)=C(Cc2ccccc2)C1=O

M882-0529 NC(c(cc1)ccc1NC(CSc(cc1)ncc1-c1nc(C2CC2)no1)=O)=O

F797-0594 Cc(cc1)cc2c1[nH]c1c2N=CN(CCC(Nc(cc2)cc(F)c2Cl)=O)C1=O

G836-0328 COCCN1C(SCc(cc2)ccc2Cl)=Nc(cc(cc2)C(NC3CCCC3)=O)c2C1=O

G836-0336 COCCN1C(SCc(cc2)ccc2F)=Nc(cc(cc2)C(NC3CCCC3)=O)c2C1=O

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.