Топологические особенности РНК-подобных молекул со случайной первичной структурой тема диссертации и автореферата по ВАК РФ 01.04.17, кандидат наук Вальба, Ольга Владимировна
- Специальность ВАК РФ01.04.17
- Количество страниц 96
Оглавление диссертации кандидат наук Вальба, Ольга Владимировна
Оглавление
Введение
1 Обзор литературы
1.1 Особенности пространственной структуры молекул РНК
1.2 Методы предсказания структуры РНК
1.3 Случайная первичная структура РНК
1.4 Термодинамические свойства
1.5 Описание РНК структур случайными матрицами
2 Алгоритмы вычисления свободной энергии РНК-подобных структур
2.1 Выравнивание последовательностей
2.2 Комплементарное связывание биополимеров
2.3 Связывание РНК с внутрипетлевым взаимодействием
2.4 Алгоритмы восстановления структуры
3 Свойства РНК структур со случайной последовательностью звеньев
3.1 Свободная энергия основного состояния
3.2 Распределение длин петель в РНК-подобных структурах
4 Топология РНК-подобных молекул в зависимости от алфавита случайной первичной структуры
4.1 Зависимость свободной энергии РНК-подобных структур от алфавита
4.2 Топологический переход в модели Бернулли
4.3 Аналитическая оценка критической точки топологического перехода в модели Бернулли
4.3.1 Метод среднего поля
4.3.2 Комбинаторная оценка
4.3.3 Матричный подход
4.4 Переход случайной РНК в замороженное состояние, ограниченный ш-пологическим переходом
4.5 Другие модели нецелого алфавита
4.5.1 Метод концентраций
4.5.2 Коррелированная случайная последовательность
4.5.3 Рациональный алфавит
5 Описание РНК-подобной структуры в терминах оптимизационной транспортной задачи
5.1 Оптимизационная транспортная задача
5.2 Модель случайных интервалов первичной структуры РНК-подобной молекулы
5.3 Топологические свойства РНК-подобных структур в модели случайных интервалов
5.3.1 Численное моделирование
5.3.2 Аналитическое описание
Заключение
Список сокращений и условных обозначений
Литература
Рекомендованный список диссертаций по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Компьютерное моделирование биомиметических макромолекул2003 год, кандидат физико-математических наук Чертович, Александр Викторович
Предсказание структурных элементов РНК с использованием экспериментальных данных2016 год, кандидат наук Виноградова Светлана Владимировна
Классификация и идентификация структурных мотивов РНК2021 год, кандидат наук Баулин Евгений Федорович
Специфика взаимодействия ряда коротких пептидов с молекулой ДНК в растворе2019 год, кандидат наук Морозова Екатерина Алексеевна
Методы предсказания структурных элементов РНК2015 год, кандидат наук Солдатов Руслан Андреевич
Введение диссертации (часть автореферата) на тему «Топологические особенности РНК-подобных молекул со случайной первичной структурой»
Введение
Актуальность темы исследования. Структура важнейших биологических макромолекул, таких как дезоксирибонуклеиновые кислоты (ДНК), рибонуклеиновые кислоты (РНК) и белки, играет ключевую роль в их правильном функционировании в клетке. Различают три уровня структурной упорядоченности биомакромолекул. Одна из основных их особенностей состоит в гетерополимерности. Послсдоваюдьность звеньев в ДНК, РНК и белках индивидуального организма, она называется первичной структурой, строго зафиксирована. Далее, биополимерные цепи могут формировать спиралеобразные и складчатые участки небольшого масштаба, как в белках, или комплементарно спаренные и петлевые участки, как в РНК. Такие фрагменты называются элементами вторичной структуры. Различают также третичную и четвертичную пространственные структуры биополимеров.
Данная работа посвящена исследованию топологических свойств вторичной структуры молекул РНК-типа. Известно, что биомакромолекулы являются «слабо отредактированными случайными гетерополимерами» [1,2]. Более того, для ряда свойств распределение мономерных звеньев в первичной структуре, например, функциональных РНК можно считать случайным [3,4]. В этом случае, модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления. Основное внимание при этом сфокусировано на нетривиальной вторичной структуре РНК-подобных полимеров, для описания которой привлекаются разнообразные техники, в том числе, техники квантовой теории поля и моделей Изин-га [5].
Цель работы заключается в описании топологических особенностей РНК-подобных последовательностей методами статистической физики и теории случайных процессов. Для достижения поставленной цели необходимо было решить следующие задачи:
1. Разработать алгоритм вычисления свободной энергии РНК-подобной молекулы,
2. Исследовать статистические свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью звеньев;
3. Изучить зависимость топологических свойств РНК-подобных структур от количества типов мономерных звеньев (алфавита), используемого в случайных первичных структурах.
Научная новизна работы заключается в следующем.
1. Впервые методами статистической физики и теории случайных процессов исследованы изменения топологических свойств РНК-подобных гетерополимеров со случайной первичной структурой в зависимости от их длины и используемого в первичной структуре алфавита.
2. Впервые теоретически обнаружено критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному и проведена аналитическая оценка точки перехода в рамках комбинаторного и матричного описания.
3. Впервые установлена взаимосвязь между наблюдаемым критическим изменением топологии РНК-подобных структур и переходом в замороженное состояние, который обсуждался ранее в работах Т. Хва и Р. Бундшу.
4. Впервые показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче.
Теоретическая и практическая значимость диссертационной работы обусловлена тем что, полученные результаты носят фундаментальный характер и дают более глубокое понимание физических закономерностей, лежащих в основе формирования вторичной структуры молекул РНК.
Методы исследования. В работе использовалось компьютерное моделирование, включающее вычисление свободной энергии основного состояния РНК-подобных молекул и предсказание соответствующих вторичных структур. В аналитическом рассмотрении широко использовалась теория случайных процессов, а также описание вторичной структуры РНК случайными матрицами.
Основные положения, выносимые на защиту:
1. алгоритмы описания вторичной структуры РНК-подобной молекулы и вычисления свободной энергии основного состояния, учитывающие внутрипетлевое взаимодействие;
2. свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью мономерных звеньев;
3. зависимость топологических свойств РНК-подобных структур от используемого в первичной структуре числа различных мономерных звеньев (алфавита). Критическое изменение топологии РНК-подобных структур при переходе от двухбук-венного алфавита к трехбуквенному;
4. топологические свойства РНК-подобных структур с выбранным распределением расстояний между мономерными звеньями и потенциалом взаимодействия между мономерами, заданным выпуклой вниз функцией от расстояния.
Достоверность изложенных в работе результатов обеспечивается использованием широко апробированных методов. Результаты находятся в соответствии с результатами, полученными ранее другими авторами.
Апробация работы. Основные результаты работы докладывались и обсуждались на 12 конференциях и 11 семинарах. По результатам диссертации опубликованы 6 статей в 5 ведущих российских и международных журналах.
Личное вклад автора заключается в развитии методов описания РНК-подобных молекул со случайной первичной структурой. Им были разработаны соответствующие алгоритмы вычисления свободной энергии РНК-подобных молекул. Все приведенные в работе расчеты и обобщение полученных результатов были выполнены автором лично.
Диссертация состоит из пяти глав и заключения. Первая глава содержит обзор литературных данных. Рассматриваются топологические особенности молекул РНК, приводятся существующие подходы к предсказанию вторичной структуры РНК. Отдельно обсуждаются термодинамические свойства РНК со случайной первичной структурой и матричный подход описания вторичной структуры РНК.
Во Второй главе приводятся алгоритмы описания РНК-подобной структуры и вычисления свободной энергии ее основного состояния. Формулируется вспомогатель-
ная статистическая модель, описывающая взаимодействия мономерных звеньев в РНК-подобной структуре с петлевыми участками. Далее, в предложенной модели учитывается вклад внутрипетлевого взаимодействия мономеров и приводится соответствующий алгоритм динамического программирования для вычисления энергии такой иерархической структуры.
Третья глава диссертации посвящена определению свойств распределения свободной энергии ансамбля случайных последовательностей РНК. Обсуждаются такие характеристики, как среднее значение свободной энергии в ансамбле, флуктуация средней энергии, распределение по длинам петель в пространственных структурах.
Анализ топологических свойств в модели случайной первичной структуры РНК-подобной молекулы в зависимости от используемой в последовательности алфавита вынесен в отдельную Четвертую главу. Показывается, что в зависимости от алфавита РНК-подобная структура характеризуется либо максимально связанной вторичной структурой без пропусков (неспаренных мономеров), либо структурой с конечной долей несвязанных мономеров. Для определения точки такого топологического перехода формулируется модель Бернулли. В рамках предложенной модели приводятся численные и аналитические оценки критической точки перехода.
В Пятой главе описывается новый подход к описанию топологии РНК-подобных структур, сформулированный в терминах оптимизационной транспортной задачи. В рамках данного подхода аналитически и численно исследуются модели РНК-подобных структур, учитывающие взаимодействие между мономерными звеньями вдоль по цепи.
В Заключении представлены основные результаты диссертационной работы.
Глава 1
Обзор литературы
Глава посвящена обзору литературных данных. Обсуждаются особенности пространственной структуры молекул РНК, приводятся известные алгоритмы предсказания таких структур. Отдельно обсуждаются свойства РНК-подобных молекул со случайной последовательностью звеньев.
1.1 Особенности пространственной структуры молекул РНК
РНК — одна из трёх основных макромолекул, которые содержатся в клетках всех'-живых организмов. Так же, как ДНК, РНК состоит из длинной цепи, в которой каждое звено называется нуклеотидом. Последовательность нуклеотидов в цепи составляет первичную структуру РНК. Каждый нуклеотид состоит из азотистого основания, сахара (рибозы) и фосфатной группы. Последовательность нуклеотидов позволяет РНК кодировать генетическую информацию. Все клеточные организмы используют РНК для программирования синтеза белков, такая РНК называется матричной (мРНК).
Образование водородных связей между нуклеотидами обеспечивает вторичную структуру РНК. Азотистые основания в составе РНК могут образовывать водородные связи между цитозином С и гуанином G , аденином А и урацилом U. Такие пары называют комплементарными (Рис. 1.1) и впервые были обнаружены Дж. Уотсопом и Ф. Криком [6]. Помимо комплементарных пар, водородные связи могут образовываться между основаниями U-G (Рис. 1.1). Такие пары называются неканоническими (Wobble
base pairs). Неканонические пары U-G влияют на вторичную и третичную структуры РНК и ее функции. В частности, было показано, что такие пары играют существенную роль в процессе кодон-антикодон связывания [7]. Теоретические расчеты показали, что энергия пары U-G сравнима с энергией основных пар C-G и A-U [8] (Табл. 1.1), однако геометрия пары отличается от канонических пар [9]. Гликозидный угол — угол, который образует связь между азотом N и сахарным остатком с плоскостью цикла сахара, одинаков для всех оснований в комплементарных парах и отличается от соответствующих углов в неканонической паре (Рис. 1.1).
n G
О.......
n — н -
Н
I
•-H-N
N —Н.....
I
Н
н
N^-H
с
н I
n —н-
.......-—-о н
К.......Н—N у—Н
V-N
и
о, н
и
h-n у—н У-N / „V
Рис. 1.1 Отличие Уотсон-Криковских пар от неканонической пары G-U.
Пара d, А
ккал/моль
G-C -5.53 2.94
A-U -4.42 2.96
G-U -4.45 3.75
Таблица 1.1 Теоретическая оценка свободной энергии и длины связи в парах нуклеотидов [8].
Характерной особенностью структуры молекул РНК является то, что система комплементарных связей вторичной структуры представляет собой «клеверный лист» (Рис. 1.2 (а)). Такая кактусообразная структура схематически может быть представлена набором вложенных дуг (Рис. 1.2 (в)), где дуга — связь между комплементарно связанными нуклеотидами в цепи. Псевдоузел — элемент вторичной структуры (Рис. 1.2 (б)) — образуется довольно редко и свойствен, в основном, длинным молекулам РНК. Псев-
доузел соответствует пересечению дуг в арочном представлении вторичной структуры (Рис. 1.2 (г)). Псевдоузлы часто несут важную функциональную роль, например, было обнаружено что структура псевдоузла в теломерной РНК существенна для активности теломеразы [10].
(а) (б) (в) (г)
Рис. 1.2 Клеверная структура РНК (а) и псевдоузел (б); (в) и (г) — арочное представление (а) и (б), соответственно.
Задача предсказания вторичной структуры РНК достаточно сложна. Вторичная структура может содержать различные элементы, отличающиеся как по энергетическому вкладу в общую энергию биополимера, так и по энтропийному вкладу (Рис. 1.3) [11-14].
Шпилька
Выпячивание
Внутренняя петля
Множественная петля
Рис. 1.3 (а) — ЗО структура транспортной РНК дрожжей, полученная рентгеноструктурным анализом [15]; (б) — элементы клеверной структуры РНК [16].
1.2 Методы предсказания структуры РНК
Наибольшую популярность приобрели методы предсказания вторичной структуры РНК, основанные на минимизации свободной энергии [11-13,17,18]. Основоположниками данного метода можно назвать М. Зукера и П. Стиглера [11]. В основе подхода лежит идея о том, что «правильная» вторичная структура РНК должна быть термодинамически наиболее стабильной и, следовательно, обладать наименьшей свободной энергией. При решении задачи минимизации энергии необходимы правила подсчета энергии для любой структуры и эффективный алгоритм минимизации энергии. На основе разнообразных экспериментальных данных [13] сделано много попыток построения правил подсчета свободной энергии и созданы достаточно эффективные алгоритмы, основанные на динамическом программировании [19]. Основное уравнение на статистическую сумму вторичной структуры РНК (Рис. 1.2 (а)) записывается как:
i+k
9i,i+k = 9i+l,i+k + ^^ ßi,s9i+l,s-l 9s+l,i+k, (1-1)
«=¿+1
где gij описывает статистический вес участка цепи с г по j мономер, а ßl0 определяется больцмановским весом контакта между inj мономерами. Основное состояние определяется как: FtJ = —кцТ In гдекв и Т — константа Больцмана и абсолютная температура, соответственно. Так как энергия комплементарной связи превышает в десятки раз квТ при комнатной температуре (Табл. 1.1), очень часто используют так называемое приближение нулевой температуры. В таком приближении, основное состояние определяется энергией взаимодействующих мономеров, тогда как, энтропией цепи можно пренебречь. Отметим, что выражение (1.1) может быть дополнено различными факторами, такими как минимальная длина петли, энергия стэкинга, различная энтропия структурных элементов РНК (Рис. 1.3 (б)). Особым случаем является предсказание пседвоузлов [20,21], для которых разрабатываются отдельные алгоритмы с использованием динамического программирования. Методы, основанные на минимизации энергии, на сегодняшний день — наиболее часто используемые. Но, к сожалению, эти алгоритмы не являются надежными, и их точность сильно падает при увеличении длины последовательности. Также следует отметить, что в настоящее время еще не разработан подход, количественно оценивающий вероятность ошибочного предсказания РНК структуры.
Один из недавно предложенных подходов основан на анализе кинетики сворачивания РНК в процессе ее синтеза [22]. При этом, в отличие от методов минимизации свободной энергии, ищутся не наиболее стабильные структуры, а структуры, кинетически доступные для сворачивания. Для этих подходов пока не проводилось массового анализа, однако, несмотря на физическую ясность подхода, этот метод содержит в себе довольно много неучтенных факторов.
Наконец, есть так называемый «биологический» подход, основанный на идее, что биологически важные вторичные структуры должны сохраняться в процессе эволюции [23]. При таком подходе анализируется не одна последовательность, а множество последовательностей, выполняющих одну биологическую функцию. Однако при анализе множества полимеров часто используют алгоритмы минимизации энергии, что влечет за собой ошибки.
Есть ряд других алгоритмов поиска оптимальной структуры, использующих методы стохастической оптимизации, в частности, генетические алгоритмы.
Таким образом, предсказание вторичной структуры молекулы РНК по ее первичной — все еще открытый вопрос и исследования в этой области продолжаются [24-27]. Особое место среди таких задач занимают задачи о связывании РНК с биополимерами (белки, ДНК, РНК). Роль таких биополимеров как ДНК и РНК в механизмах клеточной регуляции общеизвестна. Их взаимодействие является одним из необходимых этапов клеточного цикла, связанного с хранением и передачей генетической информации. Помимо общеизвестных механизмов трансляции и транскрипции информации, основанных на ДНК-РНК связывании, исключительно важную роль играют РНК-РНК взаимодействия. Эти взаимодействия имеют ключевое значение для регуляции экспрессии генов [28,29]. Молекулы РНК, посредством образования комплементарных пар, связываются с матричной РНК или ее участком и, тем самым, останавливают трансляцию генов с данной мРНК [28]. Молекулы РНК, участвующие в процессах данного типа, называются некодирующими РНК (нкРНК). Это название обусловлено тем, что они сами не транслируются в белки [29] и, следовательно, исключены из непосредственного процесса транскрипции.
Важная биологическая роль РНК-РНК взаимодействий обуславливает необходимость построения эффективного алгоритма, который бы позволил по первичным струк-
турам молекул РНК, теоретически вычислять энергию связывания, а также предсказывать вторичную структуру такого комплекса. Эта задача тесно связана с проблемой выравнивания (alignment) двух произвольных линейных последовательностей типа ДНК. Существенным отличием задачи выравнивания молекул РНК от аналогичной задачи для ДНК является наличие нетривиальной вторичной структуры у молекул РНК (Рис. 1.3). Существует ряд подходов к определению энергии РНК-РНК взаимодействия [30-34]. Однако все они применимы в своем, достаточно узком семействе РНК последовательностей и «хорошо» работают только на конкретных примерах. Проблемы определения энергии РНК-РНК связывания аналогичны проблемам, возникающим в задачах предсказания вторичной структуры РНК, и эффективность того или иного алгоритма зависит от выбора факторов, которыми можно и нельзя пренебречь.
Конечно, ограничения того или иного метода могут оказаться существенными для предсказания структуры конкретной молекулы РНК, что, в свою очередь, может привести к неверным выводам о ее функции. Однако, для исследования статистических свойств случайных последовательностей РНК, т.е. цепочек со случайной первичной структурой, достаточно учесть основополагающие свойства полимера, — для РНК, это, в первую очередь, иерархическая вторичная структура типа клеверного листа, образующаяся согласно комплементарное™ азотистых оснований, и пренебречь теми, которые влияют, в большей степени, на структуру (и функцию) конкретной молекулы — псевдоузлами, минимальной длиной петли, стэкинг-взаимодействием.
1.3 Случайная первичная структура РНК
Данная работа посвящена исследованию последовательностей со случайной первичной структурой. Известно, что биомакромолекулы являются «слабо отредактированными случайными гетерополимерами» [1,2]. Более того, для ряда задач распределение мономерных звеньев в первичной структуре, например, функциональных РНК можно считать случайным [3,4]. Модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления.
В работе рассматриваются статистические особенности вторичных структур длинных (от 1000 мономеров) случайных РНК последовательностей. Такие исследования
играют важную роль, например, в понимании того, насколько «близки» или «далеки» случайные РНК от реальных [35], какие свойства биополимера наиболее существенны для выполнения им определенной функции и, в конце концов, могли ли возникнуть функциональные РНК из случайных в ходе эволюции [36]. Случайные РНК представляют также довольно «удобную» систему для изучения термодинамических свойств реальных молекул. Исследование фазовых переходов [37-39], ответа цепочки на внешнюю силу [40,41] основаны на модели случайной первичной структуры биополимера. Существенным преимуществом этой модели является возможность охарактеризовать систему не только численно, но и аналитически.
Остановимся на двух, важных для дальнейшего рассмотрения, задачах в области статистической физики случайных РНК: термодинамических особенностях случайных РНК и описании вторичной структуры РНК случайными матрицами.
1.4 Термодинамические свойства
В рамках модели случайной РНК последовательности были сделаны важные шаги в исследовании термодинамических свойств молекул РНК. Данные исследования важны не только для предсказания структуры и функции биополимеров, но также обширно используются для разработки методов скрининга экспериментальных данных для выявления генетических маркеров заболевания [42], секвенирования одиночных нук-леотидных полиморфизмов, выбора оптимальных условий для экспериментов по гибридизации и клонированию [43,44]. Кроме того, разработка ДНК-чипов для быстрого скрининга и секвенирования основана на способности предсказывать термодинамическую устойчивость комплексов, образованных олигонуклеогидными зондами [45,46].
С пионерских работ Бундшу и Хва [37,38], несколько авторов занимались исследованиями термодинамических свойств случайных РНК [39,47-49]. К настоящему времени, принято считать, что в этой системе имеет место фазовый переход в «замороженное» состояние при низких температурах. Основываясь на репличном анализе, Лассиг и Визе, [50] и Давид и Визе [51] сформулировали задачу о переходе в терминах теории поля. Ниже приводятся доводы Бундшу и Хва, доказывающие существование фазового перехода и обсуждаются характерные свойства разных фаз.
В зависимости от температуры, случайная РНК находится в одной из фаз: i) «расплавленная» высокотемпературная фаза (molten phase) или ii) «замороженная» низкотемпературная фаза (glass phase). В высокотемпературной фазе большую роль играет энтропия цепочки, нежели порядок мономеров в первичной структуре. Данная фаза хорошо описывается в модели гомополимера, комплементарное связывание не играет роли, и эффективно можно заменить все мономеры мономерами одного типа А. Низкотемпературная фаза, наоборот, определяется, в первую очередь, первичной структурой цепочки, то есть, основной вклад в свободную энергию обусловлен комплементарным связыванием мономеров. Такую фазу принято характеризовать замороженным беспорядком [37,38]. Температура, при которой РНК переходит из одной фазы в другую, называется температурой фазового перехода и в литературе обозначается Тд.
Был предложен следующий подход к определению температуры фазового перехода. Рассмотрим пару мономеров, чье взаимодействие приводит к образованию петли наибольшего размера, т.е. нуклеотидов с номером 1 и L/2 по цепи для последовательности длиной L (Рис. 1.4(a)). Определим энергию выигрыша данного контакта, которая определяется как AF(L) — kgT In Pi,¿/2, где Pi,l/2 — вероятность связывания 1 и L/2 мономера цепи. Данную энергию называют энергией пинча, и из выражения для статистической суммы цепочки (1.1), легко видеть, что:
AF(L) = FhL - (FltL/2 + FL/2+hL). (1.2)
Вероятность образования контакта между мономерами в высокотемпературной фазе зависит только от расстояния между ними, поэтому Pi,l/2 = 2 • Энергия
пинча, таким образом,
~КР(Ь) ~ ^TlnL (1.3)
линейно зависит от температуры. Температура, при которой нарушается линейная зависимость AF(L), и есть температура фазового перехода. В численном моделировании температуру перехода обычно определяют следующим образом. Зависимость AF(L) от длины случайной последовательности РНК аппроксимируют прямой
AF(L) = а(Т) In L + b(T), (1.4)
и строят зависимость угла наклона а(Т). В высокотемпературной фазе с хорошой точностью а(Т) = |квТ (Рис. 1.5). В низкотемпературной фазе, в отличие от высокотемпе-
(а)
(б) (в)
Рис. 1.4 Вычисление энергии пинча: разделение цепочки на две половинки ограничивает число возможных конфигураций (а). Полностью комплементарные участки, один из которых лежит между 1 и ¿/2, а второй — между (Ь/2 + 1) и Ь (б) могут быть найдены почти для любой случайной РНК. Комплементарное связывание ограничивает возможные конфигурации (в). Молекула разделяется на две петли, в каждой из которых образование связей происходит независимо [38].
ратурной, выигрыш зависит, в первую очередь, от первичного беспорядка (структуры) последовательности (Рис. 1.4(6,в)). Разрыв контакта между 1 и Ь/2 мономером определяется не столько энтропийным фактором — насколько близки или далеки данные мономеры, а скорее энергетическими, т.е. средней энергией на мономер, числом несвязанных мономеров в цепочке. Зависимость наклона а(Т) = |квТ нарушается (Рис. 1.5). Низкотемпературная фаза характеризуется линейным ростом энергии пинча с уменьшением температуры. Точка пересечения двух прямых определяет температуру фазового перехода Ту. В работе [48] было высказано предположение о том, что в низкотемпературной фазе, энергия пинча зависит от логарифма длины не линейным образом (Рис. 1.5), а квадратично.
Переход между расплавленной и замороженной фазой относится к непрерывным переходам второго рода [50]. Было показано, что температура перехода Ту непосред-
I 5
т
0.5
—г
о'
о
о
х>'
о
о 0.97-2.7квТ/ит ю
о
. /и
Я О*'
V
о
л>
—1-1_к»
0.2
0.4
0.6
0.«
ки Г/и
Б т
Рис. 1.5 Зависимость наклона а{Т) уравнения (1.4) от температуры для случайной последовательности РНК [38]. Температура представлена в единицах энергии
комплементарной пары ит.
ственно связана со средним количеством несвязанных мономеров в основном состоянии [38]. Аналитическая оценка температуры перехода Тд на порядок отличается от экспериментально полученной [38].
Высокотемпературная и низкотемпературная фазы обладают разными скейлинговы-ми свойствами. Одна из величин, которая представляет интерес, — характерный размер структуры РНК. Под характерным размером /г понимают высоту соответствующей диаграммы в арочном представлении (Рис. 1.6) Было показано численно [38] и затем подтверждено аналитически [51], что низкотемпературная фаза характеризуется степенной зависимостью 1г от длины последовательности
</г>~Ьс, (1.5)
со степенью С ~ 0.64, что близко к = 2/3, и указывает на класс универсальности Кардара-Паризи-Жанга [52], характерного для таких процессов как, например, рост поверхности и баллистическая депозиция [53]. В высокотемпературной фазе численный эксперимент дает степень £ и 0.54 [38], что находится в согласии с ожидаемой величиной Со — 1 /2, характеризующей размер клубка случайного полимера [2]. Сто-
(а)
(Ь)
Рис. 1.6 Характерный размер структуры РНК в арочном представлении (а). Размер структуры определяется количеством пар, которые нужно разбить в максимально
возможной петле (б) [37].
ит отметить, что значительную роль в исследовании скейлинговых свойст случайной РНК сыграл матричный подход к описанию структуры. Построенная полевая теория перехода позволила также говорить о том, что переход происходит через образования зародышей в расплавленной фазе [50]. В следующем разделе подробно представлены основные положения описания структуры РНК случайными матрицами.
Похожие диссертационные работы по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Получение и свойства «умных» чувствительных к давлению адгезивов на основе интерполимерных комплексов2018 год, кандидат наук Бовальдинова Кермен Александровна
Оценка достоверности кластеров функционально-значимых фрагментов биологических последовательностей2012 год, кандидат физико-математических наук Фурлетова, Евгения Игоревна
Молекулярные механизмы регуляции активности белка RecA2018 год, доктор наук Байтин Дмитрий Михайлович
ДНК-белковое узнавание: Анализ первич. структур и физ.-хим. излучение1998 год, доктор физико-математических наук Полозов, Роберт Валентинович
Функциональный анализ промоторных последовательностей Е. coli: Новые промоторные детерминанты2001 год, кандидат физико-математических наук Сорокин, Анатолий Александрович
Список литературы диссертационного исследования кандидат наук Вальба, Ольга Владимировна, 2014 год
Литература
1. Птицын Б.О., Финкельштейн А. Физика белка: Курс лекций // Москва: Университет, 2002. - 376 С.
2. Гросберг Ю.А., Хохлов Р.А. Статистическая физика макромолекул / под ред. Главной редакции физико-математической литературы // Москва: Наука, 1989. — 344 С.
3. Workman С., Krogh A. No evidence that mRNAs have lower folding free energies than random sequences with the same dinucleotide distribution // Nucleic Acids Research. — 1999. - V. 27. - N. 24. - P. 4816-4822.
4. Clote P., Ferre F., Kranakis E., Krizanc D. Structural RNA has lower folding energy than randomRNA of the same dinucleotide frequency // RNA. — 2005. — V. 11. — N. 5. — P. 578-591.
5. Brezin E.E., Itzykson C., Parisi G., Zuber J.B. Planar diagrams // Communications in Mathematical Physics. - 1978. - V. 59. - N. 1. - P. 5-51.
6. Watson D.J. J, Crick H.C.F. Molecular structure of nucleic acids // Nature. — 1953. — V. 171.-P. 737-738.
7. Alberts В., Johnson A., Lewis J., Raff M., Roberts K., Walter P. Molecular Biology of the Cell / 4th ed. // New York: Garland Science, 2002. - 1616 P.
8. Vendeix F.A.P., Munoz A.M., Agris P.F. Free energy calculation of modified base-pair formation in explicit solvent: A predictive model // RNA. — 2009. — V. 15. — N. 12. — P. 2278-2287.
9. Varani G., and McClain W.H. The G-U wobble base pair // The European Molecular Biology Organization Reports. - 2000. - V. 1. — N. 1. — P. 18-23.
10. Chen J.-L. Functional analysis of the pseudoknot structure in human telomerase RNA // Proceedings of the National Academy of Sciences. — 2005. — V. 102. — N. 23. — P. 8080-8085.
11. Zuker M., Stiegler P. Optimal computer folding of large RNA sequences using thermodynamic and auxiliary information // Nucleic Acids Research. — 1981. — V. 9. — N. l.-P. 133-138.
12. Akutsu T. Dynamic programming algorithms for RNA secondary structure prediction with pseudoknots // Discrete Applied Mathematics. — 2000. — V. 104. — P. 45-62.
13. Zuker M. Mfold web server for nucleic acid folding and hybridization prediction // Nucleic Acids Research. - 2003. - V. 31. - N. 13. - P. 3406-3415.
14. Mathews D.H. Revolutions in RNA secondary structure prediction // Journal of Molecular Biology. - 2006. - V. 359. - N. 3. - P. 526-532.
15. Shi H., Moore P.B. The crystal structure of yeast phenylalanine tRNA at 1.93 A resolution: a classic structure revisited // RNA. — 2000. - V. 6. - N. 8. - P. 1091-105.
16. Zhang J., Lin M., Chen R., Wang W., Liang J. Discrete state model and accurate estimation of loop entropy of RNA secondary structures // The Journal of Chemical Physics. - 2008. - V. 128. - N. 12. - P. 125107.
17. Eddy S.R. How do RNA folding algorithms work? // Nature Biotechnology. — 2004. — V. 22. -N. 11. -P. 1457-8.
18. Hofacker I., Fontana W., Stadler P., Bonhoeffer S., Tacker M., Schuster P. Fast folding and comparison of RNA secondary structures // Monatshefte fur Chemie. — 1994. — V. 125.-P. 167-188.
19. Eddy S.R. What is dynamic programming? // Nature Biotechnology. — 2004. — V. 22. — N. 7. - P. 909-10.
20. Rivas E., Eddy S.R. A dynamic programming algorithm for RNA structure prediction including pseudoknots // Jourmal of Molecular Biology. — 1999. — V. 285. — N. 5. — P. 2053-2068.
21. Ruan J., Stormo G.D., Zhang W. An iterated loop matching approach to the prediction of RNA secondary structures with pseudoknots // Bioinformatics. — 2004. — V. 20. — N. 1. - P. 58-66.
22. Миронов А. Метод поиска консервативных структур // Молекулярная биология. — 2007. - Т. 41. - N. 4. - С. 711-18.
23. Anfinsen С.В. Principles that govern the folding of protein chains // Science. — 1973. — V. 181. - N. 4096. - P. 223-230.
24. Laing C., Schlick T. Computational approaches to 3D modeling of RNA // Journal of Physics: Condensed Matter. - 2010. - V. 22. - N. 28. - P. 283101.
25. Sato K., Kato Y., Hamada M., Akutsu Т., Asai K. IPknot: fast and accurate prediction of RNA secondary structures with pseudoknots using integer programming // Bioinformatics. - 2011. - V. 27. - N. 13. - P. i85-i93.
26. Bon M., Orland H. Tt2ne: a novel algorithm to predict RNA secondary structures with pseudoknots // Nucleic Acids Research. - 2011. — V.39. — N. 14. - P. e93-e93.
27. Bon M., Micheletti C., Orland H. Mcgenus: a Monte Carlo algorithm to predict RNA secondary structures with pseudoknots // Nucleic Acids Research. — 2013. — V. 41. — N. 3.-P. 1895-1900.
28. Ambros V. Development: Dicing up RNAs // Science. — 2001. - V. 293. — N. 5531. -P. 811-813.
29. Eddy S.R. Computational genomics of noncoding RNA genes // Cell. - 2002. - V. 109. -N. 2.-P. 137-140.
30. Gerlach W., Giegerich P. Guugle: a utility for fast exact matching under RNA complementary rules including G-U base pairing // Bioinformatics. — 2006. — V. 22. — N. 6. - P. 762-764.
31. Bernhart S. H., Tafer H., Muckstein U., Flamm C., Stadler P.F., Hofacker I.L. Partition function and base pairing probabilities of RNA heterodimers // Algorithms for Molecular Biology. - 2006. - V. 1. - N. 1. - P. 3-8.
32. Dirks R.M., Bois J.M., Schaeffer J.M., Winfree E., Pierce N.A. Thermodynamic analysis of interacting nucleic acid strands // Society for Industrial and Applied Mathematics Review. - 2007. - V. 49. - N. 1. - P. 65-88.
33. Busch A. . Richter A.S., Backofen R. IntaRNA: efficient prediction of bacterial sRNA targets incorporating target site accessibility and seed regions // Bioinformatics. — 2008. - V. 24. - N. 24. - P. 2849-56.
34. Chitsaz H., Salari R., Sahinalp S.C., Backofen R. A partition function algorithm for interacting nucleic acid strands // Bioinformatics. — 2009. — V. 25. — N. 12. — P. i365-i373.
35. Higgs P.G. RNA secondary structure: a comparison of real and random sequences // Journal de Physique I. - 1993. - V. 3. - N. 1. - P. 43-59.
36. D. Ward. The RNA world / ed. by Gesteland R. F., Atkins J.F // New York: Spring Harbor Press, 1993. - 630 P.
37. Bundschuh R., Hwa T. RNA secondary structure formation: A solvable model of heteropolymer folding // Physical Review Letters. - 1999. - V. 83. — N. 7. - P. 14791482.
38. Bundschuh R., Hwa T. Statistical mechanics of secondary structures formed by random RNA sequences // Physical Review E. - 2002. - V. 65. - N. 3. - P. 031903.
39. Pagnani A., Parisi G., Ricci-Tersenghi F. Glassy transition in a disordered model for the RNA secondary structure // Physical Review Letters. — 2000. — V. 84. — N. 9. — P. 2026-2030.
40. Maier B., Bensimon D., Croquette V. Replication by a single DNA polymerase of a stretched single-stranded DNA // Proceedings of the National Academy of Sciences. — 2000. - V. 97. - N. 22. - P. 12002-12007.
41. Tamm M., Nechaev S.K. Unzipping of two random heteropolymers: Ground-state energy and finite-size effects // Physical Review E. - 2008. - V. 78. - N. 1. - P. 011903.
42. Chee M., Yang R., Hubbell E., Berno A., Huang X.C., Stem D., Winkler J., Lockhart D.J., Morris M.S., Fodor S.P.A. Accessing genetic information with highdensity DNA arrays // Science. - 1996. - V. 274. - N. 5287. - P. 610-614.
43. Gibbs R.A. DNA amplification by the polymerase chain reaction // Analytical Chemistry.
- 1990. - V. 62. - N. 13. - P. 1202-1214.
44. Valenzuela J.G., Francischetti I., Ribeiro J. Purification, cloning, and synthesis of a novel salivary anti-thrombin from the mosquito anopheles albimanus // Biochemistry. — 1999. -V. 38.-N. 34.-P. 11209-11215.
45. Service R.F. DNA chips survey an entire genome // Science. — 1998. — V. 281. — N. 5380.-P. 1122a-l 122a.
46. Marshall A., Hodgson J. DNA chips: An array of possibilities // Nature Biotechnology.
- 1998.-V. 16.-N. 1,-P. 27-31.
47. Krzakala F., Mezard M., Muller M. Nature of the glassy phase of RNA secondary structure // Europhysics Letters. - 2002. — V. 57. — N. 5. - P. 752-758.
48. Hui S., Tang L.H. Ground state and glass transition of the RNA secondary structure // The European Physical Journal B. - 2006. - V. 53. - N. 1. - P. 77-84.
49. Monthus C., Garel T. Directed polymer in a random medium of dimension 1+1 and 1+3: weights statistics in the low temperature phase // Journal of Statistical Mechanics: Theory and Experiment. - 2007. - V. 2007. - P. 03011.
50. Lassig M., Wiese K.J. Freezing of random RNAs // Physical Review Letters. — 2006. — V. 96.-N. 22.-P. 228101.
51. David F., Wiese K.J. Systematic field theory of the RNA glass transition // Physical Review Letters. - 2007. - V. 98. - N. 12. - P. 128102.
52. Kardar M., Parisi G., Zhang Y.C. Dynamic scaling of growing interfaces // Physical Review Letters. - 1986. - V. 56. - N. 9. - P. 889-892.
53. Khanin K., Nechaev S.K., Oshanin G., Sobolevski A., Vasilyev O. Ballistic deposition patterns beneath a growing kardar-parisi-zhang interface // Physical Review E. — 2010. -V. 82.-N. 6.-P. 061107.
54. Zee A. Random matrix theory and RNA folding // Acta Physica Polonica B. — 2005. — V. 36. - N. 9. - P. 2829-36.
55. Orland H., Zee A. RNA folding and large N matrix theory // Nuclear Physics B. — 2002. - V. 620. - P. 456-476.
56. Bon M., Vernizzi G., Orland H., Zee A. Topological classification of RNA structures // Journal of Molecular Biology. - 2008. - V. 379. - N. 4. - P. 900-911.
57. Dumitriu I., Rassart E. Path counting and random matrix theory // Electronic Journal of Combinatorics. - 2003. - V. 10. - N. 1. — P. 43-59.
58. Edelman A., Rao N.R. Random matrix theory // Acta Numerica. — 2005. — V. 14. — N. l.-P. 233-297.
59. Vernizzi G., Orland H., Zee A. Enumeration of RNA structures by matrix models // Physical Review Letters. - 2005. - V. 94. - N. 16. - P. 168103.
60. Mansfield M. Efficient knot group identification as a tool for studying entanglements of polymers // The Journal of Chemical Physics. - 2007. - V. 127. - N. 24. - P. 244901.
61. Ito J., Braithwaite D.K. Compilation and alignment of DNA polymerase sequences // Nucleic Acids Research. - 1991. - V. 19. - N. 15. - P. 4045.
62. D. K., and Ito J. Compilation, alignment, and phylogenetic relationships of DNA polymerases // Nucleic Acids Research. — 1993. — V. 21. — N. 4. — P. 787.
63. Needleman S. B., Wunsch C.D. A general method applicable to the search for similarities in the amino acid sequence of two proteins // Journal of Molecular Biology. — 1970. — V. 48. -N. 3. -P. 443-453.
64. Smith T. F., Waterman M.S. Identification of common molecular subsequences // Journal of Molecular Biology. - 1981. - V. 147. - P. 195-197.
65. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool // Journal of Molecular Biology. - 1990. - V. 215. - N. 3. - P. 403-410.
66. Sankoff D. Simultaneous solution of the RNA folding, alignment and protosequence problems // Society for Industrial and Applied Mathematics: Journal on Applied Mathematics. - 1985. - V. 45. - N. 5. - P. 810-825.
67. Apostolico A., Guerra C. The longest common subsequence problem revisited // Algorithmica. - 1987. - V. 2. - N. 14. - P. 315-336.
68. Wagner R., Fischer M. The string-to-string correction problem // Journal of the Association for Computing Machinery. — 1974. — V. 21. — N. 1. — P. 168-173.
69. Gusfield D. Algorithms on strings, trees and sequences: computer science and computational biology // New York: Cambridge University Press, 1997. — 416 P.
70. Chvatal V., Sankoff D. Longest common subsequences of two random sequences // Journal of Applied Probability. - 1975. - V. 12. - N. 2. - P. 306-315.
71. Deken B. Some limit results for longest common subsequences // Discrete Mathematics. - 1979.-V. 26.-N. l.-P. 17-31.
72. Steele M.J. Long common subsequences and the proximity of two random strings // Society for Industrial and Applied Mathematics: Journal on Applied Mathematics. — 1982. - V. 42. - N. 4. - P. 731-737.
73. Dancik V., Paterson M. Upper bounds for the expected length of a longest common subsequence of two binary sequences // Random Structures and Algorithms. — 1995. — V. 6. - N. 4. - P. 449-58.
74. Alexander K.S. The rate of convergence of the mean length of the longest common subsequence // The Annals of Applied Probability. — 1994. — V. 4. — N. 4. — P. 10741082.
75. Kiwi M., Loebl M., Matouvsek J. Expected length of the longest common subsequence for large alphabets // Advances in Mathematics. - 2005. - V. 197. - N. 2. - P. 480-498.
76. Zhang M., Marr J.T. Alignment of molecular sequences seen as random path analysis // Journal of Theoretical Biology. - 1995. - V. 174. - N. 2. - P. 119-129.
77. Hwa Т., Lassig M. Similarity detection and localization // Physical Review Letters. — 1996. - V. 76. - N. 14. - P. 2591-94.
78. Boutet de Monvel J. Extensive simulations for longest common subsequences // The European Physical Journal B. - 1999. - V. 7. - N. 2. - P. 293-308.
79. Waterman M.S., Vingron M. Sequence comparison significance and poisson approximation // Statistical Science. — 1994. — V. 9. - P. 367-381.
80. Drasdo D., Hwa Т., Lassig M. Scaling laws and similarity detection in sequence alignment with gaps // Journal of Computational Biology. — 2000. — V. 7. — N. 12. — P. 115-141.
81. de Gennes P.G. Statistics of branching and hairpin helices for the dat copolymer // Biopolymers. - 1968. - V. 6. - N. 5. - P. 715-729.
82. Boutet de Monvel J. Mean-field approximations to the longest common subsequence problem // Physical Review E. - 2000. - V. 62. - N. 1. - P. 204-212.
83. Majumdar S.T., Nechaev S.K. Exact asymptotic results for the bernoulli matching model of sequence alignment // Physical Review E. - 2005. - V. 72. - N. 2. - P. 020901.
84. Kriecherbauer Т., Krug J. A pedestrian's view on interacting particle systems: KPZ universality and random matrices // Journal of Physics A: Mathematical and Theoretical. - 2010. - V. 43. - N. 40. - P. 403001.
85. Ma III. Современная теория критических явлений // Москва: Мир, 1980. — 380 С.
86. Тамм М.В., Лисаченко Н.Г., Ерухимович И.Я., Иванов В.А. Эффекты конечного объема в системе равновесных циклических полимеров: теория и компьютерное моделирование // Высокомолекулярные соединения. — 2005. — Т. 47. — N. 7. — С. 348-352.
87. Ландо К. Лекции о производящих функциях // Москва: Московский центр непрерывного математического образования, 2007. — 144 С.
88. Feller W. An introduction to probability theory and its applications. — V. 1.11 New York: Wiley, 1968. - 509 P.
89. Владимиров A.A. Паросочетаиия без пересечений // Проблемы передачи информации. - 2013. - Т. 49. - N. 1.-С. 61-65.
90. Grimmett G. What is Percolation? // New York: Springer, 1999. - 444 P.
91. Tamm M., Nechaev S. Necklace-cloverleaf transition in associating RNA-like diblock copolymers // Physical Review E. - 2007. - V. 75. - N. 3. - P. 031904.
92. Toninelli C., Biroli G., Fisher D. Jamming percolation and glass transitions in lattice models // Physical Review Letters. - 2006. - V. 96. - N. 3. - P. 035702.
93. Shannon C.E., Weaver W. A mathematical theory of communication // The Bell System Technical Journal. - 1948. - V. 27. - P. 379-423.
94. Канторович B.JI. О перемещении масс // Доклады Академии Наук СССР. — 1942. Т. 37. - N. 3 - С. 227-229.
95. Кормен Т.Х., Лейзерсон Ч.И., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ. 2-е изд. // Москва: Вильяме, 2006. — 1296 С.
96. Кузнецов В.А., Холод И.Н., Костевич С.Л. Руководство к решению задач по математическому программированию // Минск: Вышэйшая школа, 1978. — 128 С.
97. Schrijver A. Combinatorial Optimization - Polyhedra and Efficiency // New York: Springer, 2003. - 632 P.
98. Delon J., Salomon J., Sobolevski A. Local matching indicators for transport problems with concave costs // Society for Industrial and Applied Mathematics: Journal on Discrete Mathematics. - 2012. - V. 26. - N. 2. - P. 801-827.
99. Mccann R.J. Exact solutions to the transportation problem on the line // Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. — 1999. — V. 455. - N. 1984. - P. 1341-1380.
100. Aggarwal A., Bar-Noy A., Khuller S. Kravets D., Schieber B. Efficient minimum cost matching using quadrangle inequality // Journal of Algorithms. — 1995. — V. 19. — N. 1. -P. 116-143.
101. Postal M.P. Cross-over phenomena // New York: Rinehart and Winston, 1971. — 156 P.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.