Математическое моделирование антигенного сходства штаммов вируса гриппа с помощью вейвлет-преобразования тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Форгани Маджид Али

  • Форгани Маджид Али
  • кандидат науккандидат наук
  • 2018, Екатеринбург
  • Специальность ВАК РФ05.13.18
  • Количество страниц 0
Форгани Маджид Али. Математическое моделирование антигенного сходства штаммов вируса гриппа с помощью вейвлет-преобразования: дис. кандидат наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Екатеринбург. 2018. 0 с.

Оглавление диссертации кандидат наук Форгани Маджид Али

Оглавление

Основные обозначения и соглашения

Введение

1 Модель

1.1 Математическая постановка задачи

1.2 Линейная модель антигенного сходства

1.3 Вывод по главе

2 Численные методы и оптимизация

2.1 Численное отображение белка

2.2 Численное представление мутации

2.2.1 Гибридные признаки: комбинирование методов Ву и Яня с глобальными дескрипторами

2.2.2 Преобразования вейвлет и вейвлет-пакет

2.2.3 Сортировки последовательностей белка с помощью ПВП

2.3 Метод декомпозиции вейвлет-частиц

2.4 Первый вычислительный эксперимент: Изучение изменения аминокислоты в одной позиции с применением ДВЧ

2.5 Трудоемкость алгоритма ДВЧ

2.6 Второй вычислительный эксперимент: Оптимальная комбинация эвристического алгоритма с методом ДВЧ

2.7 Третий вычислительный эксперимент: Демонстрация значимости порядка соседей по отношению к ДВЧ

2.8 Формулировка метода декомпозиции вейвлет-частиц

2.9 Формула частицы

2.10 Преобразования декомпозиции вейвлет-частиц

2.11 Итерационный процесс поиска наилучшей частицы

2.12 Альтернативный метод вычисления декомпозиции частиц

2.13 Четвертый вычислительный эксперимент: Итерационная декомпозиция частиц

2.14 Выводы по главе

3 Программная реализация

3.1 Кластеризация последовательности белка

3.2 Трехмерное дерево эволюции

3.3 Программный комплекс МАГВ и его реализация

3.4 Выводы по главе

Заключение

Краткое описание цели, задач и подходов работы

Основные результаты

Перспективы

Приложение А

Вирусы гриппа и их воздействие

Антигенная изменчивость и антигенный дрейф

Белок гемагглютинин и его структура

Вакцинация и антигенная картография

Приложение В

Литература

Основные обозначения и соглашения

AAindex ACC BLAST HA

NA

АВКК АИГ

АЧО

ВИ

ВОЗ

ВПП ВП

Amino Acid Index Database (база данных аминокислотных индексов и матриц мутаций аминокислот). Absolute value of correlation coefficient (абсолютная величина коэффициента корреляции).

Basic Local Alignment Search Tool (средство поиска основного локального выравнивания).

Hemagglutinin (гемагглютинин), поверхностный белок вируса гриппа, обеспечивающий способность вируса присоединяться к клетке хозяина.

Neuraminidase (нейраминидаза), поверхностный белок вируса гриппа, обеспечивающий способность вируса освободиться от клетки хозяина.

Абсолютная величина коэффициента корреляции (absolute value of correlation coefficient).

Анализ ингибирования гемагглютинации (hemagglutination inhibition assay) - стандартный метод серологического определения инфекции гриппа и оценки сходства между разными штамами вируса гриппа.

Алфавитно-численное отображение (alphabetical-to-numerical mapping).

Метод взаимной информации (the mutual information), который способен измерить взаимную зависимость между двумя переменными.

Всемирная организация здравоохранения (World Health Organization).

Время поиска признака (feature search time). Вейвлет-преобразование (wavelet transform).

ГДА

ГСЭГО

ДНК

ДВЧ ИС

КИС

КМА

График динамики аллели (allele dynamics plot) - метод, который визуализирует эволюционную динамику различных аллелей гена в популяции с течением времени и указывает на аллели, которые, скорее всего, будут подвергнуты направленному отбору.

Глобальная система эпиднадзора за гриппом и принятия ответных мер (the global influenza surveillance system) - это уникальная всемирная сеть, способная быстро выявлять и реагировать на вспышки гриппа, в том числе с пандемическим потенциалом.

Дезоксирибонуклеиновая кислота (deoxyribonucleic acid) -это макромолекула (одна из трёх основных, две другие -РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. Метод декомпозиции вейвлет-частиц (decomposition of wavelet-particles).

Метод информационного спектра (the informational spectrum) - метод виртуальной спектроскопии для структурно-функционального анализа белков в идентификации функциональных белковых доменов. Метод консенсусного информационного спектра (consensus informational spectrum), используемого как часть анализа частотной области кросс-корреляции или кросс-ковариации между двумя временными рядами. Кратномасштабный анализ (multiresolution analysis), инструмент построения базисов вейвлета.

КМШ — Классическое многомерное шкалирование (classical multidimensional scaling) - это метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности, чем пространство признаков объектов.

МАГВ — Модель антигенности вируса гриппа (model of influenza virus antigenicity).

МГК — Метод главных компонент (principal component analysis), один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.

МШ — Многомерное шкалирование (multidimensional scaling) - метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности, чем пространство признаков объектов.

ОДВЧ — Оператор декомпозиции вейвлет-частиц (wavelet-particles' decomposition operator).

ОКК — Оптимальное количество кластеров (optimal number of clusters).

ПВП — Преобразование вейвлет-пакета (wavelet packet transform).

ПВПГ — Потенциальные вирусы пандемического гриппа (potential pandemic influenza viruses).

ПИ — Прирост информации (the information gain) - метод, поз-

воляющий измерить, насколько информация дает характеристику класса.

ПО — Программное обеспечение (software).

ПУ — Процент улучшения (improvement percentage).

РМР — Резонансная модель распознавания (the resonant recognition model), является физико-математической моделью, которая может анализировать взаимодействие белка и его мишени с использованием методов обработки сигналов.

РНК — Рибонуклеиновая кислота (ribonucleic acid) - одна из трёх основных макромолекул (две другие - ДНК и белки), которая содержится в клетках всех живых организмов и играет важную роль в кодировании, прочтении, регуляции и выражении генов.

СММ — Скрытая марковская модель (hidden Markov model) - статистическая модель, имитирующая работу процесса, похожего на марковский процесс с неизвестными параметрами, задачей ставится выявленние неизвестных параметров на основе наблюдаемых.

ФСР — Функция степени расхождения (function of disagreement degree) - это показатель несоответствия информации.

L2(R) — Пространство квадратично интегрируемых функций на числовой прямой со скалярным произведением (space of square-integrable functions).

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Математическое моделирование антигенного сходства штаммов вируса гриппа с помощью вейвлет-преобразования»

Введение

Краткое описание цели, решения и результатов исследования

Выяснение отношения между фенотипом и последовательностями белков лежит в основе многих генетических исследований, а моделирование фенотипа на основе этих данных является крайне важной задачей в генетике. Один из примеров таких задач - это моделирование и прогнозирование эволюции вируса, особенно по отношению к избеганию иммунного ответа. Вирус гриппа каждый год наносит огромный ущерб мировой экономике и влияет на жизнь и здоровье большого количества людей. Субтип гриппа ЫШ1 является самым распространенным, поэтому именно он был выбран для исследования.

Вирус состоит из макромолекул-белков, состоящих из блоков - аминокислот. В процессе эволюции вирус избегает иммунного ответа путем замены аминокислот. Эта замена как явление имеет локальное влияние на регион ее возникновения в белке.

То, что выгодно отличает данную работу от других исследований математического моделирования эволюции - это рассмотрение и извлечение локального влияния замены аминокислоты в разных масштабах путем применения созданного автором метода под названием декомпозиция вейвлет-частиц.

Белок можно рассматривать как алфавитную последовательность, состоящую из 20 букв, каждая из которых представляет собой конкретную аминокислоту. Используя физико-химические характеристики аминокис-

лот, каждую букву в последовательности можно заменить на число, отображающее ее характеристику. В результате из алфавитной последовательности производится численный одномерный сигнал, к которому можно применить методы обработки сигналов.

Метод декомпозиции вейвлет-частиц основан на теории вейвлет-преобразования. В итоге применения этого метода к одномерному сигналу, значение точки сигнала декомпозируется на разных уровнях на мелкие значения под названием частицы. Каждая частица - это линейная комбинация точек, находящихся в окрестности целевой точки, которая декомпозируется из исходного сигнала. Коэффициенты этой комбинации определяют взаимное влияние комбинируемых аминокислот.

Первый шаг к производству эффективной вакцины против гриппа состоит в измерении сходства между штаммами вируса. Обычно для этого применяется долгосрочная лабораторная процедура, основанная на химической реакции между антителами и вирусом. Во многих исследованиях по моделированию эволюции вируса используются последовательности белка гемагглютинина (HA от латинского Hemagglutinin), который играет основную роль в данной лабораторной процедуре. Другими словами, задача определяется таким образом, что на вход модели подаются две последовательности белка гемагглютинина анализируемых штаммов вируса; цель состоит в оценке (предсказании) значения их сходства, подтверждаемого результатами лабораторных анализов. Чтобы измерить расстояние между аминокислотами, находящимся в конкретной позиции в анализируемых штаммах, используя метод декомпозиции вейвлет-частиц, производится множество линейных комбинаций и выбирается та, которая дает большую корреляцию с результатами лабораторных наблюдений.

Секвенирование, т.е. получение последовательности белка, не настолько трудоемкий процесс, как лабораторная процедура измерения сходства между штаммами вируса. Поэтому математическая модель, основанная на последовательности белка, позволит сохранить время и ресурсы, действовать более оперативно в борьбе с вирусом.

В работе увеличивается точность моделирования с помощью двух факторов. Первый фактор - это рассмотрение аминокислоты как многомерного объекта, где каждая ее физико-химическая характеристика отображается в численной форме отдельной координаты. Второй фактор - это рассмотрение мутации как локального явления, а не как точечной замены аминокислоты. Предполагается, что учет этих факторов при построении модели позволит уменьшить ошибку моделирования.

Описания генетических понятий, таких как белок гемагглютинина, анализ ингибирования гемагглютинации, антиген и антигенные участки даны в приложении А, где предоставлен обзор сведений о вирусе гриппа, его воздействии, молекулярных характеристиках, способах изменения, вакцинации и ее эффективности.

Далее во введении будут рассмотрены:

1. Содержательная постановка задачи.

2. Степень разработанности темы исследования, недостатки существующих методов и их весомость.

3. Теоретическая и практическая значимость работы.

4. Актуальность, цель, задачи и научная новизна работы.

Содержательная постановка задачи

Математическая задача связана с оценкой сходства между штаммами вируса гриппа. Цель моделирования - прогнозирование результатов биологического измерения (в лаборатории) штаммов на основе математического отношения между заменой аминокислоты в последовательности НА и этими результатами. Биологическое измерение определяет, насколько штамм отклонился от предыдущих штаммов. Другими словами, это измерение показывает результат эволюции, которая связана с антигенностью вируса.

Антигены являются молекулярными структурами на поверхности вирусов, которые распознаются иммунной системой и способны вызвать им-

мунный ответ (в виде антител). Антигенность вируса определяется способностью вируса вызывать иммунный ответ организма на антиген. В течение эволюции вирус изменяет комбинацию последовательности его белков путем точечной мутации, удаления или добавления аминокислоты, чтобы изменить свои характеристики и избежать иммунного ответа организма. Изменение аминокислоты, находящейся в антигенных участках, является критически важным для антигенной эволюции.

Чтобы выяснить и измерить антигенное сходство между штаммами вируса гриппа, производится процедура анализа ингибирования гемагглюти-нации (АИГ). В процессе АИГ антитела одного штамма применяются на другом штамме и их действие записывается в численной форме, известной как значение титра.

Цель моделирования - прогнозирование значения титра для новых появляющихся штаммов в сравнении с предыдущими штаммами. Как ранее было упомянуто, поскольку результаты АИГ основаны на реакции белка гамагглютинина, входными данными модели являются последовательности белка гемагглютинина штаммов, а выходными - прогнозируемое значение титра (см. рис. 0.1).

Рисунок 0.1: Общая схема задачи моделирования и прогнозирования значения титра.

Схема на рисунке 0.1 основана на отношении между последовательностями белка НА и логарифмом значения титра. Известно, что существует линейное отношение между заменами аминокислоты антигенных участков в последовательности НА и логарифмом значения титра результатов АИГ.

Ранее это отношение было использовано другими исследователями в нескольких работах [1-3]. В диссертации также используется это отношение при построении переменных модели. Однако, замена аминокислоты

рассматривается не как изменение самой аминокислоты, а как локальное изменение в регионе ее нахождения. Это локальное изменение учитывается как изменение в линейной комбинации, состоящей из аминокислот, находящихся в окрестности целевой аминокислоты. Такой взгляд предположительно позволит подсчитать влияние замены аминокислоты в окрестности антигенного участка, даже если аминокислота этого участка не изменилась. Далее представлена идея использования линейной комбинации, взятая из биологического концепта под названием эффект соседства, который связан с влиянием аминокислот друг на друга. Именно этот фактор уменьшает ошибку модели. Хотя в работе не рассматривается роль аминокислоты в разных структурах белка, таких как вторичная, третичная или четвертичная, полученные результаты на основе последовательности белка как одномерного сигнала представляются вполне удовлетворительными.

Крайне важной задачей при создании модели являлся поиск релевантных признаков, которые описывают целовую функцию. Для этого автор предлагает использовать весьма известный метод вейвлет-преобразования. Вейвлет-преобразование декомпозирует сигнал на низкочастотный и высокочастотный компоненты, каждый из которых находится в соответствующей подполосе. После декомпозиции, можно работать с двумя видами информации подполос. Первая - это коэффициенты декомпозиции, которые представляют компактную и сжатую форму сигнала в подполосе. А второй - это восстановленный сигнал из этих коэффициентов. В работе используется только второй вид.

В декомпозиции вейвлет-преобразования, декомпозиция продолжается на низкочастотный компонент, в то время как высокочастотный компонент сохраняется без изменения. Иногда высокочастотный компонент также содержит важную информацию и необходимо его тоже декомпозировать. В этом случае используется преобразование вейвлет-пакета. Уровень декомпозиции в обоих преобразованиях ограничен 1од2^), где N это количество точек сигнала. В результате декомпозиции на каждом уровне можно получить несколько восстановленных сигналов, которые, если их суммировать,

приблизительно составят исходный сигнал. Таким образом, можно сказать, что для каждой точки в исходном сигнале есть отображение в подпространствах подполос. Каждую точку каждого восстановленного сигнала можно записать как линейную комбинацию нескольких точек исходного сигнала.

В методах извлечения признаков из подполос декомпозиции преобразования вейвлет-пакета иногда создаётся вектор, каждый элемент которого извлечен из одной подполосы. Взяв отображения точки исходного сигнала, можно изучать отношение между подполосами декомпозиции. Основная идея работы - это рассмотрение отображения точки исходного сигнала как нового вектора, а точнее нового сигнала, на который можно применить преобразование вейвлет-пакета заново. На основе этой идеи был создан математический инструмент под названием декомпозиция вейвлет-частиц, декомпозирующая значение точки сигнала на мелкие значения под названием частицы, каждая из которых представляет собой упомянутую ранее линейную комбинацию. В отличие от преобразования вейвлет-пакета, уровень декомпозиции вейвлет-частиц не ограничен, однако, на основе теории вейвлета, ошибки вычисления восстановления сигнала с уровнем декомпозиции увеличиваются.

В качестве основы модели, используется линейная модель смешанных эффектов. Так как база данных АИГ имеет повторное измерение, и поскольку отношение переменных к цели моделирования (логарифму значения титра) линейное, эта модель хорошо подходит для данной задачи. Модель смешанных эффектов ранее была использована другими исследователями в некоторых работах по моделированию антигенности вируса [1-3]. Подробности о математической модели предоставлены в первой главе работы.

Далее рассматриваются известные методы моделирования антигенности вируса гриппа, обсуждаются их достоинства и недостатки.

Современное состояние исследований в области антигенной эволюции

Методы изучения антигенности группируются на две категории, первая включает методы, основанные на филогенетике и популяционной генетике, а вторая - статистические методы. Также существуют методы, которые дополнительно используют эпидемиологические данные [4].

Некоторые методы используют информацию об изменениях физико-химических свойств аминокислот и их отношениях с антигенностью [5-8]. Так как количество свойств может быть большим, что затруднит вычисление, то в некоторых работах (таких как [6]) множество свойств аминокислоты было кластеризировано.

В группе статистических методов были использованы различные подходы, такие как взаимное отношение между двумя сайтами [9], методы машинного обучения [7,10], использование вариации на антигенных участках [11], прирост информации и энтропия [12].

Можно определить разные расстояния между штаммами (генетические, антигенные, аминокислотные и т.д.) с целью визаулизации штаммов и демонстрации их отношений. Примеры использования таких расстояний в подходах, основанных на методе многомерного шкалирования, можно найти в многочисленных работах, см. напр. [13-15].

Ключевым аргументом в пользу методов филогенетики и генетики популяции является то, что генетические последовательности вируса гриппа тесно связаны друг с другом и не являются независимыми наблюдениями, как это требуется для большинства известных методов статистического анализа.

Филогенетические данные были использованы при разработке метода вывода «антигенных деревьев» [16]; в работе [17], где развивается подход к сопоставлению вирусов (тестового и референтного) на основе филогенетического дерева; в работе [18], где объединяются генетическая, эволюционная, антигенная и структурная информация для определения наиболее

релевантных областей НА вирусов гриппа; в работе [19], где описывается байесовская версия антигенной картографии; в разработке динамической модели [20], которая успешно прогнозирует ежегодную эволюцию отдельных генов гриппа; в работе [15], где создается подход к раннему выяв-лению(выделению) новых доминирующих штаммов; в разработке метода графики динамики аллели (ГДА) [21]; в работах [17,22] для браузерной обработки и визуализации данных штаммов вируса; в создании метода графики динамической развертки [23]; и [24].

Далее будут кратко рассмотрены некоторые из этих подходов.

Большинство исследований для разработки прогностических метрик, способны вывести антигенные свойства из данных генотипа. Метод взаимной информации (ВИ) использовался для вычисления корреляции между любыми двумя позициями в белке, таким образом генерируя ВИ-матрицу для всех пар позиций. Была создана сеть, известная как сеть позиционного перехода [9], основанная на временных ВИ-матрицах. Сеть отображает историю генетической эволюции вируса, в которой раскрывается основной механизм антигенных дрейфов. Применялся анализ кластеризации, чтобы разделить ВИ-матрицу на кластеры, где показаны различные группы сайтов с сильно коррелированными и совместно встречающимися мутациями. Эти кластеры также раскрывают скрытые антигенные изменения - как характерные внутренние участки, так и связывание межкластерных участков, ответственных за антигенные дрейфы. Также было сделано сравнение сети с антигенными картами, созданными Смитом и др. [13]. В антигенной карте используется результат АИГ для измерения расстояния между штаммами гриппа в антигенном пространстве. Расстояние между любыми двумя вирусными штаммами представляет собой перекрестный иммунитет различных соответствий. Было обнаружено, что как сеть, так и антигенная карта указывают на многие аналогичные характерные особенности [9].

В нескольких исследованиях использовались статистические модели для прогнозирования антигенного варианта на основе АИГ штаммов вируса гриппа и их соответствующих последовательностей НА. Кроме того, бы-

ло [13] продемонстрированно, что антигенная эволюция была более акцентирована, чем генетическая эволюция, и генетическое изменение может привести к непропорционально большому антигенному эффекту. В последнее время в исследованиях обсуждается взаимосвязь между эволюцией и совместно-мутированными позициями вируса гриппа [12].

Потенциальные иммунодоминантные положения определяются как аминокислотные замены, которые положительно связаны с антигенными расстояниями. С помощью ступенчатой множественной регрессии и информации, полученной из классов подобия из физико-химических свойств аминокислот был [7] смоделирован антигенный вариант. Последовательности штаммов вируса сравнивались с последовательностями штаммов вакцин, рекомендованными ВОЗ, на основе их года выделения, а затем были предсказаны их сходства по модели. Модели обеспечивают приемлемую стратегию включения биоинформатики в статистические методы и дальнейшую идентификацию потенциальных иммунодоминантных позиций для прогнозирования антигенных вариантов, которые могут быть легко интегрированы в глобальную систему эпиднадзора за гриппом. Более того, эти методы могут также применяться к другим сильно изменяемым вирусам.

Хотя молекулярное упорядочение является высокопроизводительным и надежным, филогенетическое дерево, основанное на анализе последовательностей, по-прежнему не может уверенно прогнозировать антигенные варианты, поскольку у него отсутствует хороший критерий для определения того, как расстояние между двумя вирусами может быть связано с антигенными вариантами. Поэтому можно комбинировать сравнения последовательности и антигенные расстояния в разработке модели для прогнозирования антигенных вариантов [7].

Был предложен математический метод расчета «антигенной зависимости» между двумя штаммами (представленный в процентах) в качестве геометрического среднего из двух соотношений между титрами (значениями) гетерологичных и гомологичных антител АИГ. Например, если гомологичные титры двух штаммов составляют 640 и

640 и два гетерологичных титра друг против друга составляют 320 и 320, антигенная взаимосвязь между этими двумя штаммами равна ([320 х 320]/[640 х 640])1/2 = 50%, а антигенное расстояние между этими двумя штаммами ([640 х 640]/[320 х 320])1/2 = 2 (антигенное расстояние < 4, т.е. аналогичная антигенность, антигенное расстояние > 4, т.е. антигенный вариант). С помощью данного подхода изучена связь между положениями аминокислот и антигенным расстоянием [25].

В работе [7] предложена модель на основе оценки физико-химической группировки аминокислоты и регрессии для прогнозирования антигенных вариантов. Основываясь на собранных последовательностях субтипа гриппа А/Н3К2, выделенных в период между 1971 и 2002 годами, получилось точно прогнозировать антигенные варианты в 1999-2004 годах (коэффициент согласования = 91.67%). Двадцать аминокислотных позиций, идентифицированных в модели, вносят значительный вклад в антигенную разницу и являются потенциальными иммунодоминантными положениями. Эти позиции можно использовать для ускорения процесса отбора вакцинного штамма.

Был разработан метод [12] идентификации антигенных критических аминокислотных положений, правил и совмещенных мутированных позиций для антигенных вариантов. Прирост информации (ПИ) и энтропия использовались для измерения оценки положения аминокислоты на НА и различия между антигенными вариантами и аналогичными штаммами. Предполагается, что позиция с высокой ПИ и энтропией сильно коррелирует с антигенным дрейфом. Самые высокие и самые низкие значения как ПИ, так и энтропии равны 1 и 0 соответственно. Аминокислота с высоким ПИ в определенном положении подразумевала, что это положение сильно коррелирует с антигенными вариантами. Аминокислота с высокой энтропией означает, что это положение часто мутирует в наборе данных. Все позиции можно разделить на четыре группы по значениям ПИ (антигенная степень) и энтропии (т.е. генетическое разнообразие).

В исследовании [12] были найдены девятнадцать позиций с высоким ПИ

и высоким генетическим разнообразием, идентифицирующимся как антигенные критические положения на белках НА. Большинство этих антигенных критических положений находятся на пяти эпитопах или на поверхности, основанных на структуре НА. Основываясь на значениях ПИ и энтропиях этих 19 позиций на НА, дерево решений применялось для создания модели на основе правил и определения правил для прогнозирования антигенных вариантов. Предсказательная точность этой модели на двух наборах составляет более 90%.

С использованием обширных исторических записей последовательностей НА в течение 90 лет была разработана [26] вычислительная модель для моделирования динамической эволюции антигенных участков в А/НШ1. С шаблонами антигенных последовательностей модель может эффективно прогнозировать потенциальное распределение будущих антигенных мутаций. Результаты показали, что мутационный профиль будущих антигенных участков можно предсказать на основе исторических эволюционных следов, несмотря на широко распространенные случайные мутации в гриппе. Расчетная модель была разработана для моделирования будущего распределения новых антигенных мутаций на основе эволюционных следов на антигенных участках. Результаты дают убедительные доказательства того, что профиль будущих антигенных вариантов НА можно предсказать по их собственным эволюционным траекториям, несмотря на широкие, быстрые и постоянные изменения.

Графики динамики аллели (ГДА), визуализируют эволюционную динамику различных аллелей гена в популяции по времени и указывают на аллели, которые, скорее всего, будут подвергнуты направленному отбору. Был создан [27] метод прогнозирования наиболее подходящего штамма для производства вакцины против сезонного гриппа А (Н3К2) путем выявления антигенно новых аллелей НА, которые находятся на пути к доминированию. Этот метод включает:

• восстановление филогенетического дерева,

• построение ГДА из этого дерева и использование времени выборки

изолята для идентификации трех аллелей НА, которые, скорее всего, станут преобладающими в будущем,

• построение антигенного дерева из филогенетического дерева и расстояний АИГ и выявление антигенного воздействия на три аллеля НА и

• если был идентифицирован антигенно новый НА-аллель (с антигенным весом по меньшей мере 0.5 антигенной единицы), то он вероятно, станет преобладающим и подходящим для включения в вакцину для сезона гриппа в следующем году.

В процедуре принятия решений по результатам вычислительных испытаний были получены хорошие совпадения штамма вакцины с циркулирующим преобладающим штаммом в течение большинства сезонов и могут использоваться для поддержки прогноза, проведенного ВОЗ с помощью экспертов; таким образом, это может позволить увеличить эффективность вакцины.

В работе [14] создана практическая модель, позволяющая прогнозировать эволюционное направление вируса, которое вызывает будущие эпидемии, и проверена точность прогнозирования на основе модели. Сначала проанализированы относительные расстояния аминокислотных последовательностей среди прошлых эпидемических штаммов с использованием метода многомерного шкалирования (МШ). Обнаружено, что вирусы гриппа человека эволюционировали по криволинейному эволюционному пути с приблизительно постоянной кривизной в 3Э-пространстве, создаваемом МШ. Выполняя МШ-анализ, можно получить визуальную карту объектов, где разница между объектами представляется как расстояние между соответствующими точками. В полученной 3Э-карте каждая последовательность НА была представлена как точка, а количество различных аминокислот между двумя последовательностями НА было представлено как относительное расстояние между двумя соответствующими точками. Кроме того, были использованы параметры гамма-распределения для прогнозирования аминокислотных замен в НА в последующие годы. Анализы

ретроспективного прогнозирования в течение 12 лет с 1997 по 2009 год показали, что 70% фактических аминокислотных замен были правильно предсказаны и что 45% предсказанных аминокислотных замен действительно наблюдалось. Хотя остается нерешенным, как предсказать точное время антигенных изменений, настоящие результаты показывают, что модель может иметь потенциал для распознавания возникающих эпидемических штаммов.

В работе [28] для идентификации потенциальных вирусов пандемического гриппа (ПВПГ) представлен новый филогенетический алгоритм, основанный на методе информационного спектра (ИС) путем прогнозирования мутаций в гене вирусного НА, которые, по-видимому, (по-разному) влияют на критические взаимодействия между белком НА и клетками-мишенями птичьего и человеческого происхождения, соответственно. Данные результаты свидетельствуют о том, что алгоритм на основе ИС подходит для определения ПВПГ среди штаммов вирусов гриппа А, которые циркулируют у животных и, таким образом, могут стать новым инструментом для оценки рисков пандемии, связанных с конкретными штаммами. Частоты ИС соответствуют распределению структурных мотивов с определенными физико-химическими свойствами, определяющими биологическую функцию белка. При сравнении белков, которые имеют одну и ту же биологическую или биохимическую функцию, метод ИС позволяет обнаруживать пары кода/частоты, которые:

• специфичны для их общих биологических свойств или

• коррелируют со своим специфическим взаимодействием(-ями).

Эти общие информационные характеристики последовательностей определяются взаимным спектром или консенсусным информационным спектром (КИС). Таким образом, КИС является преобразованием Фурье корреляционной функции для спектра. Поэтому исключается любая спектральная составляющая (частота), которая отсутствует во всех сравниваемых информационных спектрах. Пиковые частоты в КИС представляют собой

общую информацию, закодированную в первичной структуре анализируемых последовательностей. Эта информация соответствует дальнейшему взаимодействию между анализируемыми белками или их взаимодействию с общим интерактором. Анализ ИС позволяет:

• прогнозировать биологическую функцию белка;

• сравнить биологическую активность в группе белков с той же функцией;

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Список литературы диссертационного исследования кандидат наук Форгани Маджид Али, 2018 год

Литература

[1] Identification of low-and high-impact hemagglutinin amino acid substitutions that drive antigenic drift of influenza A (H1N1) viruses / William T Harvey, Donald J Benton, Victoria Gregory [h gp.] // PLoS pathogens. 2016. T. 12, № 4. C. e1005526.

[2] Harvey William Thomas. Quantifying the genetic basis of antigenic variation among human influenza A viruses. Ph.D. thesis: University of Glasgow. 2016.

[3] Sequence-based prediction for vaccine strain selection and identification of antigenic variability in foot-and-mouth disease virus / Richard Reeve, Belinda Blignaut, Jan J Esterhuysen [h gp.] // PLoS computational biology. 2010. T. 6, № 12. C. e1001027.

[4] In Silico Vaccine Strain Prediction for Human Influenza Viruses / Thorsten R Klingen, Susanne Reimering, Carlos A Guzman [h gp.] // Trends in Microbiology. 2018. T. 26, № 2.

[5] Suzuki Yoshiyuki. Predictability of antigenic evolution for H3N2 human influenza A virus // Genes & genetic systems. 2013. T. 88, № 4. C. 225232.

[6] Using multiple linear regression and physicochemical changes of amino acid mutations to predict antigenic variants of influenza A/H3N2 viruses / Haibo Cui, Xiaomei Wei, Yu Huang [h gp.] // Bio-medical materials and engineering. 2014. T. 24, № 6. C. 3729-3735.

[7] Bioinformatics models for predicting antigenic variants of influenza A/H3N2 virus / Yu-Chieh Liao, Min-Shi Lee, Chin-Yu Ko [h gp.] // Bioinformatics. 2008. T. 24, № 4. C. 505-512.

[8] Mapping of H3N2 influenza antigenic evolution in China reveals a strategy for vaccine strain recommendation / Xiangjun Du, Libo Dong, Yu Lan [h gp.] // Nature communications. 2012. T. 3. C. 709.

[9] Using a mutual information-based site transition network to map the genetic evolution of influenza A/H3N2 virus / Zhen Xia, Gulei Jin, Jun Zhu [h gp.] // Bioinformatics. 2009. T. 25, № 18. C. 2309-2317.

[10] Computational identification of antigenicity-associated sites in the hemagglutinin protein of a/h1n1 seasonal influenza virus / Xiaowei Ren,

Yuefeng Li, Xiaoning Liu [h gp.] // PloS one. 2015. T. 10, № 5. C. e0126742.

[11] Lees William D, Moss David S, Shepherd Adrian J. A computational analysis of the antigenic properties of haemagglutinin in influenza A H3N2 // Bioinformatics. 2010. T. 26, № 11. C. 1403-1408.

[12] Huang Jhang-Wei, King Chwan-Chuen, Yang Jinn-Moon. Co-evolution positions and rules for antigenic variants of human influenza A/H3N2 viruses // BMC bioinformatics. 2009. T. 10, № 1. C. S41.

[13] Mapping the antigenic and genetic evolution of influenza virus / Derek J Smith, Alan S Lapedes, Jan C de Jong [h gp.] // science. 2004. T. 305, № 5682. C. 371-376.

[14] Gnarled-trunk evolutionary model of influenza A virus hemagglutinin / Kimihito Ito, Manabu Igarashi, Yutaka Miyazaki [h gp.] // PLoS One. 2011. T. 6, № 10. C. e25953.

[15] He Jiankui, Deem Michael W. Low-dimensional clustering detects incipient dominant influenza strain clusters // Protein Engineering, Design & Selection. 2010. T. 23, № 12. C. 935-946.

[16] Steinbriick Lars, McHardy Alice Carolyn. Inference of genotype-phenotype relationships in the antigenic evolution of human influenza A (H3N2) viruses // PLoS computational biology. 2012. T. 8, № 4. C. e1002492.

[17] Prediction, dynamics, and visualization of antigenic phenotypes of seasonal influenza viruses / Richard A Neher, Trevor Bedford, Rodney S Daniels [h gp.] // Proceedings of the National Academy of Sciences. 2016. T. 113, № 12. C. E1701-E1709.

[18] Determination of antigenicity-altering patches on the major surface protein of human influenza A/H3N2 viruses / Christina Kratsch, Thorsten R Klingen, Linda Miimken [h gp.] // Virus evolution. 2016. T. 2, № 1.

[19] Integrating influenza antigenic dynamics with molecular evolution / Trevor Bedford, Marc A Suchard, Philippe Lemey [h gp.] // Elife. 2014. T. 3.

[20] Positive selection on the H3 hemagglutinin gene of human influenza virus A. / Robin M Bush, Walter M Fitch, Catherine A Bender [h gp.] // Molecular biology and evolution. 1999. T. 16, № 11. C. 1457-1465.

[21] Steinbriick Lars, McHardy Alice Carolyn. Allele dynamics plots for the study of evolutionary dynamics in viral populations // Nucleic acids research. 2010. T. 39, № 1. C. e4-e4.

[22] Neher Richard A, Russell Colin A, Shraiman Boris I. Predicting evolution from the shape of genealogical trees // Elife. 2014. T. 3.

[23] Sweep Dynamics (SD) plots: Computational identification of selective sweeps to monitor the adaptation of influenza A viruses / Thorsten R Klingen, Susanne Reimering, Jens Loers [h gp.] // Scientific reports. 2018. T. 8, № 1. C. 373.

[24] Positive Darwinian evolution in human influenza A viruses. / Walter M Fitch, JM Leiter, XQ Li [h gp.] // Proceedings of the National Academy of Sciences. 1991. T. 88, № 10. C. 4270-4274.

[25] Lee Min-Shi, Chen Jack Si-En. Predicting antigenic variants of influenza A/H3N2 viruses // Emerging infectious diseases. 2004. T. 10, № 8. C. 1385.

[26] Predicting the mutating distribution at antigenic sites of the influenza virus / Hongyang Xu, Yiyan Yang, Shuning Wang [h gp.] // Scientific reports. 2016. T. 6. C. 20239.

[27] Steinbriick L, Klingen TR, McHardy AC. Computational prediction of vaccine strains for human influenza A (H3N2) viruses // Journal of virology. 2014. T. 88, № 20. C. 12123-12132.

[28] In Silico prediction and experimental confirmation of HA residues conferring enhanced human receptor specificity of H5N1 influenza A viruses / Sonja Schmier, Ahmed Mostafa, Thomas Haarmann [h gp.] // Scientific reports. 2015. T. 5. C. 11434.

[29] Complex resonant recognition model in analysing influenza a virus subtype protein sequences / Charalambos Chrysostomou, Huseyin Seker, Nizamettin Aydin [h gp.] // Information Technology and Applications in Biomedicine (ITAB), 2010 10th IEEE International Conference on / IEEE. 2010. C. 1-4.

[30] Jin Lixia, Fang Weiwu, Tang Huanwen. Prediction of protein structural classes by a new measure of information discrepancy // Computational Biology and Chemistry. 2003. T. 27, № 3. C. 373-380.

[31] AAindex: amino acid index database, progress report 2008 / Shuichi Kawashima, Piotr Pokarowski, Maria Pokarowska [h gp.] // Nucleic acids research. 2007. T. 36, № suppl_1. C. D202-D205.

[32] Castro-Chavez Fernando. The rules of variation: amino acid exchange according to the rotating circular genetic code // Journal of theoretical biology. 2010. T. 264, № 3. C. 711-721.

[33] Arinaminpathy Nimalan, Grenfell Bryan. Dynamics of glycoprotein charge in the evolutionary history of human influenza // PloS one. 2010. T. 5, № 12. C. e15674.

[34] Differences in the biological phenotype of low-yielding (L) and high-yielding (H) variants of swine influenza virus A/NJ/11/76 are associated with their different receptor-binding activity / AS Gambaryan,

MN Matrosovich, CA Bender [h gp.] // Virology. 1998. T. 247, № 2. C. 223-231.

[35] Kobayashi Yuki, Suzuki Yoshiyuki. Compensatory evolution of net-charge in influenza A virus hemagglutinin // PloS one. 2012. T. 7, № 7. C. e40422.

[36] Tomii Kentaro, Kanehisa Minoru. Analysis of amino acid indices and mutation matrices for sequence comparison and structure prediction of proteins // Protein Engineering, Design and Selection. 1996. T. 9, № 1. C. 27-36.

[37] GenomeNet. AAindex - Amino acid indices, substitution matrices and pair-wise contact potentials. 2018. URL: http://www.genome.jp/aaindex/.

[38] Xia Xuhua, Xie Zheng. Protein structure, neighbor effect, and a new index of amino acid dissimilarities // Molecular biology and evolution. 2002. T. 19, № 1. C. 58-67.

[39] Ghadimi Mahin, Khalifeh Khosrow, Heshmati Emran. Neighbor effect and local conformation in protein structures // Amino acids. 2017. T. 49, № 9. C. 1641-1646.

[40] Look-up tables for protein solvent accessibility prediction and nearest neighbor effect analysis / Jung-Ying Wang, Shandar Ahmad, M Michael Gromiha [h gp.] // Biopolymers. 2004. T. 75, № 3. C. 209-216.

[41] Minimalist representations and the importance of nearest neighbor effects in protein folding simulations / Andres Colubri, Abhishek K Jha, Min-yi Shen [h gp.] // Journal of molecular biology. 2006. T. 363, № 4. C. 835-857.

[42] Neighbor effect on PPII conformation in alanine peptides / Kang Chen, Zhigang Liu, Chunhui Zhou [h gp.] // Journal of the American Chemical Society. 2005. T. 127, № 29. C. 10146-10147.

[43] How do Nearest-Neighbor Interactions Effect the Conformational Distributions in Peptides? / Siobhan Toal, Reinhard Schweitzer-Stenner, Karin Rybka [h gp.] // Biophysical Journal. 2013. T. 104, № 2. C. 55a.

[44] Neighbor-dependent Ramachandran probability distributions of amino acids developed from a hierarchical Dirichlet process model / Daniel Ting, Guoli Wang, Maxim Shapovalov [h gp.] // PLoS computational biology. 2010. T. 6, № 4. C. e1000763.

[45] The nearest-neighbor effect on random-coil NMR chemical shifts demonstrated using a low-complexity amino-acid sequence / Tsai-Chen Chen, Chih-Lun Hsiao, Shing-Jong Huang [h gp.] // Protein and peptide letters. 2016. T. 23, № 11. C. 967-975.

[46] Sherif Fayroz F, Kadah Yasser, El-Hefnawi Mahmoud. Classification of human vs. non-human, and subtyping of human influenza viral

strains using Profile Hidden Markov Models // Biomedical Engineering (MECBME), 2011 1st Middle East Conference on / IEEE. 2011. C. 221224.

[47] Cozzone Alain J. Proteins: Fundamental chemical properties // eLS. 2010.

[48] Chou Kuo-Chen, Zhang Chun-Ting. A new approach to predicting protein folding types // Journal of protein chemistry. 1993. T. 12, № 2. C. 169178.

[49] Prediction of protein structural class with Rough Sets / Youfang Cao, Shi Liu, Lida Zhang [h gp.] // Bmc Bioinformatics. 2006. T. 7, № 1. C. 20.

[50] Novel numerical characterization of protein sequences based on individual amino acid and its application / Yan-ping Zhang, Ya-jun Sheng, Wei Zheng [h gp.] // BioMed research international. 2015. T. 2015.

[51] Yan Shao-Min, Wu Guang. Prediction of mutation position, mutated amino acid and timing in hemagglutinins from North America H1 influenza A virus // Journal of Biomedical Science and Engineering. 2009. T. 2, № 02. C. 117.

[52] Editorial [Hot topic: Genomic Signal Processing: Part 1 (Guest Editors: ER Dougherty, X. Cai, Y. Huang, S. Kim and R. Yamaguchi)] / Edward R Dougherty, Xiaodong Cai, Yufei Huang [h gp.] // Current Genomics. 2009. T. 10, № 6. C. 364-364.

[53] Kwan Hon Keung, Arniker Swarna Bai. Numerical representation of DNA sequences // Electro/Information Technology, 2009. eit'09. IEEE International Conference on / IEEE. 2009. C. 307-310.

[54] Kawashima Shuichi, Ogata Hiroyuki, Kanehisa Minoru. AAindex: amino acid index database // Nucleic acids research. 1999. T. 27, № 1. C. 368369.

[55] Chou Kuo-Chen. Using amphiphilic pseudo amino acid composition to predict enzyme subfamily classes // Bioinformatics. 2004. T. 21, № 1. C. 10-19.

[56] Venkatarajan Mathura S, Braun Werner. New quantitative descriptors of amino acids based on multidimensional scaling of a large number of physical-chemical properties // Molecular modeling annual. 2001. T. 7, № 12. C. 445-453.

[57] Sjostrom Michael, Wold Svante. A multivariate study of the relationship between the genetic code and the physical-chemical properties of amino acids // Journal of molecular evolution. 1985. T. 22, № 3. C. 272-277.

[58] Ruch David K, Van Fleet Patrick J. Wavelet theory: An elementary approach with applications. John Wiley & Sons, 2011.

[59] The use of the Hilbert transform in ECG signal analysis / D Benitez, PA Gaydecki, A Zaidi [h gp.] // Computers in biology and medicine. 2001. T. 31, № 5. C. 399-406.

[60] Saini Shiwani, Dewan Lillie. Comparison of Sequence Variation of H5N1 Influenza a Virus using Wavelets.

[61] Mallat Stephane. A wavelet tour of signal processing. Academic press, 1999.

[62] Müller Peter, Vidakovic Brani. Bayesian inference in wavelet-based models. Springer Science & Business Media, 2012. T. 141.

[63] Tzanetakis George, Essl Georg, Cook Perry. Audio analysis using the discrete wavelet transform // Proc. Conf. in Acoustics and Music Theory Applications. T. 66. 2001.

[64] Donoho David L, Johnstone Jain M. Ideal spatial adaptation by wavelet shrinkage // biometrika. 1994. T. 81, № 3. C. 425-455.

[65] Donoho David L. De-noising by soft-thresholding // IEEE transactions on information theory. 1995. T. 41, № 3. C. 613-627.

[66] Data compression and harmonic analysis / David L. Donoho, Martin Vetterli, Ronald A. DeVore [h gp.] // IEEE Transactions on Information Theory. 1998. T. 44, № 6. C. 2435-2476.

[67] Daubechies Ingrid. Ten lectures on wavelets. Siam, 1992. T. 61.

[68] Application of Wavelet Packet Transform to detect genetic polymorphisms by the analysis of inter-Alu PCR patterns / Maurizio Cardelli, Matteo Nicoli, Armando Bazzani [h gp.] // BMC bioinformatics. 2010. T. 11, № 1. C. 593.

[69] Jiang Rong, Yan Hong. Studies of spectral properties of short genes using the wavelet subspace Hilbert-Huang transform (WSHHT) // Physica A: Statistical Mechanics and its Applications. 2008. T. 387, № 16-17. C. 4223-4247.

[70] Ning Jianchang, Moore Charles N, Nelson J Clare. Preliminary wavelet analysis of genomic sequences // Bioinformatics Conference, 2003. CSB 2003. Proceedings of the 2003 IEEE / IEEE. 2003. C. 509-510.

[71] Fourier and wavelet transform analysis, a tool for visualising regular patterns in DNA / Guy Dodin, Pierre Vandergheynst, Patrick Levoir [h gp.] // Journal of Theoretical Biology. 2000. T. 206, № EPFL-ARTICLE-86700. C. 323-326.

[72] Li Shutao, Liao Chen, Kwok James T. Wavelet-based feature extraction for microarray data classification // Neural Networks, 2006. IJCNN'06. International Joint Conference on / IEEE. 2006. C. 5028-5033.

[73] Characterizing long-range correlations in DNA sequences from wavelet analysis / Alain Arneodo, Emmanuel Bacry, PV Graves [и др.] // Physical Review Letters. 1995. Т. 74, № 16. С. 3293.

[74] Graps Amara. An introduction to wavelets // IEEE computational science and engineering. 1995. Т. 2, № 2. С. 50-61.

[75] A Wavelet Packet Based Approach for the Research of the Avian Influenza virus cross-species infection / Shasha Li, Yuanchun Zhou, Zheng Kou [и др.] // Networking and Distributed Computing (ICNDC), 2010 First International Conference on / IEEE. 2010. С. 301-304.

[76] Coifman Ronald R, Wickerhauser M Victor. Entropy-based algorithms for best basis selection // IEEE Transactions on information theory. 1992. Т. 38, № 2. С. 713-718.

[77] Saini SHIWANI, Dewan LILLIE. Graphical method to determine base change locations in genomic sequences of influenza a virus using wavelets // WSEAS Trans Biol Biomed. 2014. Т. 11. С. 70-81.

[78] Saini Shiwani, Dewan Lillie. Application of discrete wavelet transform for analysis of genomic sequences of Mycobacterium tuberculosis // SpringerPlus. 2016. Т. 5, № 1. С. 64.

[79] Qiang Xiaoli, Kou Zheng. Prediction of interspecies transmission for avian influenza A virus based on a back-propagation neural network // Mathematical and Computer Modelling. 2010. Т. 52, № 11-12. С. 20602065.

[80] Lio Pietro, Vannucci Marina. Wavelet change-point prediction of transmembrane proteins // Bioinformatics. 2000. Т. 16, № 4. С. 376-382.

[81] Eng Christine LP, Tong Joo Chuan, Tan Tin Wee. Predicting host tropism of influenza A virus proteins using random forest // BMC medical genomics. 2014. Т. 7, № 3. С. S1.

[82] Форгани МА. ВЫДЕЛЕНИЕ НОВЫХ ПРИЗНАКОВ ДЛЯ ИЗУЧЕНИЯ МУТАЦИИ В БЕЛКЕ ВИРУСА ГРИППА // Научно-технический вестник Поволжья. 2017. № 3. С. 136-138.

[83] Forghani M., Vasev P., V. Averbukh. Three-Dimensional Visualization for Phylogenetic Tree // Scientific Visualization. 2017. Т. 9, № 4. С. 59-66.

[84] Форгани Маджид Али, Кожевин Александр Вячеславович. Статистическое сравнение вейвлет-преобразований в обработке сигналов нормальных электрокардиограмм // Вестник Тамбовского государственного технического университета. 2017. Т. 23, № 1.

[85] Forghani Majid, Khani Rouhollah. A multivariate clustering of AAindex database for protein numerical representation // Intelligent Systems and Signal Processing (ICSPIS), 2017 3rd Iranian Conference on / IEEE. 2017. С. 1-4.

[86] Nezhadi Mohammad M Alyan, Forghani Majid, Hassanpour Hamid. Text language identification using signal processing techniques // Intelligent Systems and Signal Processing (ICSPIS), 2017 3rd Iranian Conference on / IEEE. 2017. С. 147-151.

[87] A Novel View on Elimination EEG Cardiac Artifacts: Emphasis on The Artifacts of External Origin / M Forghani, D Chegodaev, P Pavlova [и др.] // JOURNAL OF HEAD TRAUMA REHABILITATION / LIPPINCOTT WILLIAMS & WILKINS TWO COMMERCE SQ, 2001 MARKET ST, PHILADELPHIA, PA 19103 USA. Т. 33. 2018. С. E94-E95.

[88] EV0481 - Frontal EEG asymmetry in full-term infants and infants born preterm / D Chegodaev, P Pavlova, M Forghani [и др.] // 26th European Congress of Psychiatry / European Psychiatry 48S (2018). Т. 48. 2018. С. S607-S608.

[89] Сцены визуализации в вычислительных блокнотах / П. Ва-сев, В. Авербух, Бахтерев М. [и др.] // In Proceedings of the 28th International Conference on Computer Graphics and Vision GraphiCon'2018. 2018. С. 99-102.

[90] Форгани М. Particle Decomposition: A Wavelet-based Method with Application in Protein Comparison // Современные проблемы математики и ее приложений СоПроМат-г.Екатеринбург, 2018. 2018. С. 8081.

[91] Интерактивная визуализация вычеслений в веб-среде / П. Васев, Бахтерев М., Д. Филоненко [и др.] // Современные проблемы математики и ее приложений СоПроМат-г.Екатеринбург, 2018. 2018. С. 56-56.

[92] Forghani M., Vasev P., V. Averbukh. A Visualization System for Binary Rooted Trees // GraphiCon 2017 : 27th Intern. Conf. on Computer Graphics and Vision : proceeding. Perm : Perm State University. 2017. С. 71-73.

[93] Форгани МА, Кожевин АВ. Классификация вейвлетов для удаления шума из сигнала нормальной кардиограммы // Параллельные вычислительные технологии (ПаВТ'2015). 2015. С. 527-527.

[94] Форгани МА, Кожевин АВ. Улучшение метода шумоподавления для сигнала ЭКГ, основанного на циклическом вращении с постоянным сдвигом // Параллельные вычислительные технологии (ПаВТ'2015). 2015. С. 528-528.

[95] Human former seasonal Influenza A(H1N1) haemagglutination inhibition data 1977-2009 from the WHO Collaborating Centre for Reference and Research on Influenza - London, UK: Tech. Rep.: / V. Gregory, W. T. Harvey, R. S. Daniels [и др.]: University of Glasgow, 2016.

[96] Pinheiro Jose C, Bates Douglas M. Linear mixed-effects models: basic concepts and examples // Mixed-effects models in S and S-Plus. 2000. C. 3-56.

[97] Sparse Bayesian variable selection for the identification of antigenic variability in the foot-and-mouth disease virus / Vinny Davies, Richard Reeve, William Harvey [h gp.] // Artificial Intelligence and Statistics. 2014. C. 149-158.

[98] Fitting linear mixed-effects models using lme4 / Douglas Bates, Martin Machler, Ben Bolker [h gp.] // arXiv preprint arXiv:1406.5823. 2014.

[99] Constrained k-means clustering with background knowledge / Kiri Wagstaff, Claire Cardie, Seth Rogers [h gp.] // ICML. T. 1. 2001. C. 577-584.

[100] Understanding of internal clustering validation measures / Yanchi Liu, Zhongmou Li, Hui Xiong [h gp.] // Data Mining (ICDM), 2010 IEEE 10th International Conference on / IEEE. 2010. C. 911-916.

[101] Rousseeuw Peter J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis // Journal of computational and applied mathematics. 1987. T. 20. C. 53-65.

[102] Tibshirani Robert, Walther Guenther, Hastie Trevor. Estimating the number of clusters in a data set via the gap statistic // Journal of the Royal Statistical Society: Series B (Statistical Methodology). 2001. T. 63, № 2. C. 411-423.

[103] Prediction of RNA-binding proteins from primary sequence by a support vector machine approach / Lian Yi Han, Cong Zhong Cai, Siew Lin Lo [h gp.] // Rna. 2004. T. 10, № 3. C. 355-368.

[104] SVM-Prot: web-based support vector machine software for functional classification of a protein from its primary sequence / CZ Cai, LY Han, Zhi Liang Ji [h gp.] // Nucleic acids research. 2003. T. 31, № 13. C. 36923697.

[105] Prediction of MHC-binding peptides of flexible lengths from sequence-derived structural and physicochemical properties / J Cui, LY Han, HH Lin [h gp.] // Molecular immunology. 2007. T. 44, № 5. C. 866877.

[106] Wu G, Yan S-M. Prediction of distributions of amino acids and amino acid pairs in human haemoglobin a-chain and its seven variants causing a-thalassaemia from their occurrences according to the random mechanism // Comparative Haematology International. 2000. T. 10, № 2. C. 80-84.

108

109

110

111 112 113

114

115

116

117

118

Wu Guang, Yan Shaomin. Determination of sensitive positions to mutations in human p53 protein // Biochemical and biophysical research communications. 2004. T. 321, № 2. C. 313-319.

Wu Guang, Yan Shaomin. Prediction of possible mutations in H5N1 hemagglutitins of influenza A virus by means of logistic regression // Comparative Clinical Pathology. 2006. T. 15, № 4. C. 255.

on Sharing All Influenza Data Global Initiative. EpiFlu Database. 2018. URL: https://www.gisaid.org.

Size properties of wavelet packets / Ronald R Coifman, Yves Meyer, Mladen Victor Wickerhauser [h gp.] // Wavelets and their applications. 1992. C. 453-470.

Signal processing and compression with wavelet packets / Ronald R Coifman, Yves Meyer, Steven Quake [h gp.] // Wavelets and their applications. Springer, 1994. C. 363-379.

Hu Xiao, Wang Zhizhong, Ren Xiaomei. Classification of surface EMG signal using relative wavelet packet energy // Computer methods and programs in biomedicine. 2005. T. 79, № 3. C. 189-195.

Hu Guo-Sheng, Zhu Feng-Feng, Ren Zhen. Power quality disturbance identification using wavelet packet energy entropy and weighted support vector machines // Expert Systems with Applications. 2008. T. 35, № 1-2. C. 143-149.

Yen Gary G, Lin K-C. Wavelet packet feature extraction for vibration monitoring // IEEE transactions on industrial electronics. 2000. T. 47, № 3. C. 650-667.

Luhanga Edith T, Luhanga Matthew L. A pyramid algorithm for the Haar discrete wavelet packet transform // Global Journal of Pure and Applied Sciences. 2014. T. 20, № 2. C. 127-134.

Harman Mark. The current state and future of search based software engineering // 2007 Future of Software Engineering / IEEE Computer Society. 2007. C. 342-357.

Vasev P. Three-dimensional visualization in a web based environment based on Qml declarative description // International (47th all-Russian) youth school-conference, Yekaterinburg, January 31 - February 6, 2016. 2016.

Letunic Ivica, Bork Peer. Interactive Tree Of Life (iTOL): an online tool for phylogenetic tree display and annotation // Bioinformatics. 2006. T. 23, № 1. C. 127-128.

Kumar Sudhir, Stecher Glen, Tamura Koichiro. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets // Molecular biology and evolution. 2016. T. 33, № 7. C. 1870-1874.

[120] PDB ID: 3LZG Structural basis of preexisting immunity to the 2009 H1N1 pandemic influenza virus / Rui Xu, Damian C Ekiert, Jens C Krause [h gp.] // Science. 2010. C. 1186430.

[121] The Protein Data Bank / H.M. Berman, J. Westbrook, Z. Feng [h gp.] // Nucleic Acids Research. 2000. T. 28. C. 235-242.

[122] Brownlee GG, Fodor E. The predicted antigenicity of the haemagglutinin of the 1918 Spanish influenza pandemic suggests an avian origin. // Philosophical Transactions of the Royal Society of London. Series B. 2001. T. 356, № 1416. C. 1871.

[123] Analysis of adaptation mutants in the hemagglutinin of the influenza A (H1N1) pdm09 virus / Alicia Jimenez-Alberto, Esmeralda Alvarado-Facundo, Rosa Maria Ribas-Aparicio [h gp.] // PloS one. 2013. T. 8, № 7. C. e70005.

[124] Influenza human monoclonal antibody 1F1 interacts with three major antigenic sites and residues mediating human receptor specificity in H1N1 viruses / Tshidi Tsibane, Damian C Ekiert, Jens C Krause [h gp.] // PLoS pathogens. 2012. T. 8, № 12. C. e1003067.

[125] Identification of a highly conserved H1 subtype-specific epitope with diagnostic potential in the hemagglutinin protein of influenza A virus / Rongmao Zhao, Shujuan Cui, Li Guo [h gp.] // PloS one. 2011. T. 6, № 8. C. e23374.

[126] Correlation of influenza virus excess mortality with antigenic variation: application to rapid estimation of influenza mortality burden / Aiping Wu, Yousong Peng, Xiangjun Du [h gp.] // PLoS computational biology. 2010. T. 6, № 8. C. e1000882.

[127] Crystal structure of the swine-origin A (H1N1)-2009 influenza A virus hemagglutinin (HA) reveals similar antigenicity to that of the 1918 pandemic virus / Wei Zhang, Jianxun Qi, Yi Shi [h gp.] // Protein & cell. 2010. T. 1, № 5. C. 459-467.

[128] The hemagglutinin of the influenza A (H1N1) pdm09 is mutating towards stability / Juan A Castelan-Vega, Anastasia Magana-Hernandez, Alicia Jimenez-Alberto [h gp.] // Advances and applications in bioinformatics and chemistry: AABC. 2014. T. 7. C. 37.

[129] Schrodinger, LLC. The PyMOL Molecular Graphics System, Version 1.8. (PyMOL The PyMOL Molecular Graphics System, Version 1.8, Schrodinger, LLC.)

[130] Attaluri Pavan K, Chen Zhengxin, Lu Guoqing. Applying neural networks to classify influenza virus antigenic types and hosts // Computational Intelligence in Bioinformatics and Computational Biology (CIBCB), 2010 IEEE Symposium on / IEEE. 2010. C. 1-6.

132

133

134

135

136

137

138

139

140

141

Alexander DJ, Brown IH. Recent zoonoses caused by influenza A viruses // Revue Scientifique et Technique-Office International des Epizooties. 2000. T. 19, № 1. C. 197-215.

Evolutionarily conserved protein sequences of influenza a viruses, avian and human, as vaccine targets / AT Heiny, Olivo Miotto, Kellathur N Srinivasan [h gp.] // PloS one. 2007. T. 2, № 11. C. e1190.

Wu Guang, Yan Shaomin. Fate of 130 hemagglutinins from different influenza A viruses // Biochemical and biophysical research communications. 2004. T. 317, № 3. C. 917-924.

Ferguson Neil M, Anderson Roy M. Predicting evolutionary change in the influenza A virus // Nature medicine. 2002. T. 8, № 6. C. 562.

Neher Richard A, Bedford Trevor. nextflu: real-time tracking of seasonal influenza virus evolution in humans // Bioinformatics. 2015. T. 31, № 21. C. 3546-3548.

Predicting the evolution of human influenza A / Robin M Bush, Catherine A Bender, Kanta Subbarao [h gp.] // Science. 1999. T. 286, № 5446. C. 1921-1925.

Comparing PCA to information gain as a feature selection method for Influenza-A classification / Nemin Shaltout, Mohamed Moustafa, Ahmed Rafea [h gp.] // Intelligent Informatics and Biomedical Sciences (ICIIBMS), 2015 International Conference on / IEEE. 2015. C. 279-283.

Qi X, Pang B, Lu CP. Genetic characterization of H1N1 swine influenza A viruses isolated in eastern China // Virus Genes. 2009. T. 39, № 2. C. 193.

Hemagglutinin and neuraminidase matching patterns of two influenza A virus strains related to the 1918 and 2009 global pandemics / Yonghui Zhang, Xiaojing Lin, Fengwei Zhang [h gp.] // Biochemical and biophysical research communications. 2009. T. 387, № 2. C. 405-408.

Krammer Florian. Novel universal influenza virus vaccine approaches // Current opinion in virology. 2016. T. 17. C. 95-103.

Antibody recognition of the pandemic H1N1 Influenza virus hemagglutinin receptor binding site / Minsun Hong, Peter S Lee, Ryan MB Hoffman [h gp.] // Journal of virology. 2013. T. 87, № 22. C. 12471-12480.

[142] Networks link antigenic and receptor-binding sites of influenza hemagglutinin: mechanistic insight into fitter strain propagation / Venkataramanan Soundararajan, Shu Zheng, Neel Patel [h gp.] // Scientific reports. 2011. T. 1. C. 200.

144

145

146

147

148

149

150

151

152

153

154

Somvanshi Pallavi, Singh Vijai, Arshad M. Modeling of RNA secondary structure of non structural gene and evolutionary stability of the influenza virus through in silico methods // JPB. 2008. Т. 1. С. 219-226.

Tsybalova Liudmila, I Kiselev O. Universal influenza vaccines: Developments, prospects for use // Voprosy virusologii. 2012. 01. Т. 57. С. 9-14.

Эффективность кросс-протективной рекомбинантной противогриппозной вакцины, включающей консервативные эпитопы вирусных белков М2 и гемагглютинина / ЛА Степанова, МА Шуклина, ЕА Бло-хина [и др.] // Журнал инфектологии. 2018. Т. 9, № 4. С. 43-52.

Long term trends in the evolution of H (3) HA1 human influenza type A / Walter M Fitch, Robin M Bush, Catherine A Bender [и др.] // Proceedings of the National Academy of Sciences. 1997. Т. 94, № 15. С. 7712-7718.

Effect of statin use on influenza vaccine effectiveness / Huong Q McLean, Brian DW Chow, Jeffrey J VanWormer [и др.] // The Journal of infectious diseases. 2016. Т. 214, № 8. С. 1150-1158.

Recombinant influenza vaccines / ES Sedova, DN Shcherbinin, AI Migunov [и др.] // Acta Naturae (англоязычная версия). 2012. Т. 4, № 4 (15).

Carrat Fabrice, Flahault Antoine. Influenza vaccine: the challenge of antigenic drift // Vaccine. 2007. Т. 25, № 39-40. С. 6852-6862.

Development of high-yield influenza A virus vaccine viruses / Jihui Ping, Tiago JS Lopes, Chairul A Nidom [и др.] // Nature communications. 2015. Т. 6. С. 8148.

Fouchier Ron AM, Smith Derek J. Use of antigenic cartography in vaccine seed strain selection // Avian diseases. 2010. Т. 54, № s1. С. 220-223.

Epochal evolution shapes the phylodynamics of interpandemic influenza A (H3N2) in humans / Katia Koelle, Sarah Cobey, Bryan Grenfell [и др.] // Science. 2006. Т. 314, № 5807. С. 1898-1903.

Plotkin Joshua B, Dushoff Jonathan, Levin Simon A. Hemagglutinin sequence clusters and the antigenic evolution of influenza A virus // Proceedings of the National Academy of Sciences. 2002. Т. 99, № 9. С. 6263-6268.

Identifying potential immunodominant positions and predicting antigenic variants of influenza A/H3N2 viruses / Min-Shi Lee, Meng-Chun Chen, Yu-Chieh Liao [и др.] // Vaccine. 2007. Т. 25, № 48. С. 8133-8139.

Публикации автора по теме диссертации в ведущих рецензируемых журналах из списка ВАК

• Forghani Мй]гс1, Vasev Pavel, Averbukh Vladimir Three Dimensional Visualization for Phylogenetic Tree // Scientific Visualization. 2017. Quarter. 4, Vol. 9, N 4. P. 59-66.(индексируется в Scopus)

• Форгани М.А. Выделение новых признаков для изучения мутации в белке вируса гриппа // Научно-технический вестник Поволжья.2017, 3, стр. 136-138 3 стр.

• Форгани М.А., Кожевин А.В. Статистическое сравнение вейвлет-преобразований в обработке сигналов нормальных электрокардиограмм // Вестник Тамбовского государственного технического уни-верситета.23, 1, 2017, C. 61-71.(индексируется в Chemical Abstracts)

и другие публикации

• Васев П.А., Авербух В.Л., Бахтерев М.О., Манаков Д.В., Филонен-коД.Ю, Форгани М.А. Сцены визуализации в вычислительных блокнотах // In Proceedings of the 28th International Conference on Computer Graphics and Vision GraphiCon'2018, P. 99-102.

• Форгани М.А. Particle Decomposition: A Wavelet-based Method with Application in Protein Comparison // Современные проблемы математики и ее приложений СоПроМат-2018, Екатеринбург^ 80-81, 2018 г.

• Васев П.А., Бахтерев М.О.,Форгани М.А., Филоненко Д.Ю. Интерактивная визуализация вычеслений в веб-среде // Современные проблемы математики и ее приложений СоПроМат-2018, Екатеринбург^ 56-56, 2018 г.

• Forghani M, Chegodaev D, Pavlova P, Pavlova N, Lvova O A Novel View on Elimination EEG Cardiac Artifacts: Emphasis on The Artifacts of External Origin // JOURNAL OF HEAD TRAUMA

REHABILITATION. 2018. - Т. 33. - №. 3. - С. E94-E95.(индексируется в Web of Science)

• Chegodaev D, Pavlova P, Forghani M, Pavlova N, Lvova O EV0481 -Frontal EEG asymmetry in full-term infants and infants born preterm // 26th European Congress of Psychiatry / European Psychiatry 48S (2018), V. 48, P. 607-608.(индексируется в Scopus)

• Forghani M, Khani R A multivariate clustering of AAindex database for protein numerical representation // In Proceedings of the 3rd Iranian Conference on Intelligent Systems and Signal Processing (ICSPIS), 2017,P. 1-4.(индексируется в Scopus и Web of Science)

• Nezhadi MMA , Forghani M, Hassanpour H Text language identification using signal processing techniques // In Proceedings of the 3rd Iranian Conference on Intelligent Systems and Signal Processing (ICSPIS), 2017,P. 147-151.(индексируется в Scopus и Web of Science)

• Forghani Мajid, Vasev Pavel, Averbukh Vladimir A Visualization System for Binary Rooted Trees // In Proceedings of the 27th International Conference on Computer Graphics and Vision GraphiCon'2017, P. 71-73.

• Форгани М.А., Кожевин А.В. Улучшение метода шумоподавления для сигнала ЭКГ, основанного на циклическом вращении с постоянным сдвигом // Труды международной научной конференции Параллельные вычислительные технологии (ПаВТ) 2015, C. 528-528.

• Форгани М.А., Кожевин А.В. Классификация вейвлетов для удаления шума из сигнала нормальной кардиограммы // Труды международной научной конференции Параллельные вычислительные технологии (ПаВТ) 2015, C. 527-527.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.