Анализ транскриптома Mycobacterium avium методом широкомасштабного секвенирования тема диссертации и автореферата по ВАК РФ 03.01.03, кандидат наук Игнатов, Дмитрий Васильевич

  • Игнатов, Дмитрий Васильевич
  • кандидат науккандидат наук
  • 2013, Москва
  • Специальность ВАК РФ03.01.03
  • Количество страниц 98
Игнатов, Дмитрий Васильевич. Анализ транскриптома Mycobacterium avium методом широкомасштабного секвенирования: дис. кандидат наук: 03.01.03 - Молекулярная биология. Москва. 2013. 98 с.

Оглавление диссертации кандидат наук Игнатов, Дмитрий Васильевич

Оглавление

Список сокращений

Обзор литературы. Использование широкомасштабного секвенирования для изучения бактериального транскриптома

Введение

Методология RNA-seq

Технологические платформы ССП

Подготовка РНК к секвенированию

Модификации RNA-seq

Синтез и амплификация кДНК

Обработка данных ШЧА-вед

Примеры использования RNA-seq

Экспрессия мРНК

Некодирующий транскриптом

Исследование некодирующего транскриптома микобактерий

Заключение

Материалы и методы

Материалы и лабораторное оборудование

Оборудование

Расходные материалы

Коммерческие наборы и ферменты

Химические реактивы

Буферные и другие растворы

Олигонуклеотиды

Методы и протоколы

/

Электрофоретическое разделение фрагментов нуклеиновых кислот в агарозном геле

Трансформация компетентных клеток вектором, несущим вставку, и высев клеток на

селективную среду

Выделение плазмид

Определение нуклеотидной последовательности вставок рекомбинантных клонов библиотек

Выращивание М. avium и заражение мышей

Выделение РНК из М. avium

Выделение геномной ДНК из М. avium

Разделение фрагментов РНК в денатурирующем полиакриламидном геле

Синтез кДНК из коротких фрагментов РНК

5' SMART-RACE, 3' RACE и проверка на котранскрипцию для межгенных малых РНК

Подготовка РНК к секвенированию на Illumina

Обработка данных секвенирования РНК

Нозерн-блоттинг

RLM-RACE

Количественная ПЦР в реальном времени

Программное обеспечение

Результаты и обсуждение

Введение

Малые РНК М. avium, выявленные клонированием коротких фрагментов и поиском гомологов у М. tuberculosis

Транскриптом М. avium при росте в культуре, определённый методом RNA-seq

Транскрипция с межгенных участков превышает транскрипцию белок-кодирующих генов в средне-логарифмической фазе роста

Геном М. avium hominissuis 104 содержит 25 полиморфизмов протяженных последовательностей (LSP), отсутствующих у М. avium ТМС724

76% генов М. avium транскрибируется на значимом уровне

Треть из выявленных ТНТ соответствуют безлидерным транскриптам

Рибопереключатели М. avium

Некодирующие РНК М. avium, выявленные с помощью RNA-seq

Межгенные малые РНК М. avium и М. tuberculosis

Экспрессия igMAV_0468-0469 и igMAV_0469-0470 при развитии инфекции

Выводы

Список литературы

Приложение 1: Скрипты

Приложение 2: Антисмысловые РНК

Яу

Список сокращений

АФС - аденозин-5 '-фосфосульфат дНТФ - дезоксинуклеозидтрифосфат ДСН - дуплекс-специфичная нуклеаза кДНК - комплементарная ДНК мРНК - матричная РНК ОНП - однонуклеотидный полиморфизм ОРС - открытая рамка считывания ССП - секвенатор следующего поколения ТНТ - точка начала транскрипции

dRNA-seq - differential RNA-seq

FRT-seq - flowcell reverse transcription sequencing

LSP - large sequence polymorphism

RACE - rapid amplification of cDNA ends

RNA-seq - sequencing of RNA

SMRT - single molecule real-time sequencing

TAP - tobacco acid pyrophosphatase

TEX - terminal exonuclease

Обзор литературы. Использование широкомасштабного секвенирования для изучения бактериального транскриптома

Рекомендованный список диссертаций по специальности «Молекулярная биология», 03.01.03 шифр ВАК

Введение диссертации (часть автореферата) на тему «Анализ транскриптома Mycobacterium avium методом широкомасштабного секвенирования»

Введение

Транскриптом - это полный набор транскриптов, находящихся в клетке в определённый момент времени. У бактерий качественный и количественный состав транскриптома во многом определяются условиями внешней среды. Изучение транскриптома необходимо для выявления и описания функциональных элементов генома, таких как промоторы, точки начала транскрипции, единицы транскрипции, регуляторные некодирующие области и нетранслируемые области. Кроме того, анализ транскриптома может использоваться для выявления молекулярных механизмов, участвующих в регуляции жизнедеятельности бактериальной клетки [1].

Детальный анализ транскриптомов многих видов бактерий стал возможным благодаря появлению микроэрреев, а затем методов широкомасштабного секвенирования. Эти исследования сформировали новую область молекулярной биологии, названную транскриптомикой [2]. Транскриптомика наряду с другими «омиками», такими как геномика, протеомика и метаболомика, являются частью системной биологии [3]. Системная биология нацелена на всеобъемлющее описание всех компонентов и процессов в биологической системе и последующий анализ поведения этой системы как единого целого [4]. Отличительной особенностью системной биологии является огромное количество информации, для анализа которой необходимы компьютерные алгоритмы обработки и визуализации данных [3]. Бактериальная транскриптомика не является исключением: значительную часть методологии исследования транскриптома составляет биоинформатическая обработка данных.

На сегодняшний день для широкомасштабного исследования транскриптомов в-основном используются две технологии: микроэрреи и секвенаторы следующего поколения (ССП). Исследование транскриптомов с помощью ССП получило название КЫА-зец («секвенирование РНК»), Несмотря на такое название, секвенируется не РНК, а кДНК, построенная на матрице РНК [5]. В эксперименте с помощью микроэрреев также сначала синтезируется кДНК, которая затем гибридизуется с микроэрреем [6]. Первые ССП были разработаны несколькими фирмами в 5 - 2007 годах [5]. Как микроэрреи,

так и ССП, представлены нескольким технологическими платформами, которые достаточно сильно различаются между собой [5, 7]. RNA-seq обладает рядом преимуществ по сравнению с микроэрреями: позволяет определить границы транскриптов с точностью до одного нуклеотида, способен выявлять ОНП и обладает большей точностью в измерении уровней транскрипции. Кроме того, RNA-seq может использоваться для исследования транскриптома даже тех организмов, для которых неизвестна последовательность генома [2]. Благодаря этим преимуществам RNA-seq стал мощным инструментом для изучения физиологии микроорганизмов.

Данный литературный обзор посвящен использованию RNA-seq для изучения транскриптомов прокариот и архей. В первой части обзора речь пойдет о технологической стороне экспериментов RNA-seq. Будут описаны платформы ССП, методы подготовки образцов РНК к секвенированию, процесс секвенирования и стратегии обработки результатов. Также будет рассказано о модификациях RNA-seq, позволяющих изучить те или иные особенности транскриптома. Вторая часть обзора будет посвящена научным открытиям, сделанным с помощью RNA-seq, основным из которых является обнаружение широко распространённых некодирующих РНК у бактерий.

Методология 1ША-8ед

Технологические платформы ССП

Ключевым принципом работы ССП является параллельное секвенирование большого числа молекул нуклеиновых кислот. Процесс секвенирования можно разделить на два этапа: (1) подготовка матрицы для секвенирования; (2) секвенирование и фиксирование информации о нуклеотидной последовательности. Коммерческие платформы ССП используют различные технологические решения для осуществления этих этапов [5]. Именно этими решениями определяются особенности данных, получаемых разными ССП, такие как длина секвенированного фрагмента, суммарное количество секвенированных нуклеотидов, а также типичные ошибки в определении последовательности.

Подготовка матрицы для секвенирования._Для проведения параллельного секвенирования сотен тысяч или миллионов последовательностей, необходимо физически отделить молекулы с разными последовательностями друг от друга. Это достигается путём компартментализации молекул ДНК. При этом считывание информации о последовательности ДНК проводится независимо для каждого компартмента. В зависимости от технологии ССП, в одном компартменте могут секвенироваться либо клонально-амплифицированные фрагменты с одинаковой последовательностью, либо одна молекула ДНК. Технологические платформы, основанные на секвенировании клонально-амплифицированных фрагментов, относят ко второму поколению секвенаторов, а платформы, секвенирующие одну молекулу ДНК, относят к третьему поколению секвенаторов. При этом к первому поколению относят автоматические секвенаторы, основанные на принципе Сэнгера [5]. При секвенировании клонально-амплифицированных фрагментов, сигнал детекции каждого из секвенированных нуклеотидов суммируется из множества сигналов от каждой индивидуальной молекулы ДНК. Такой сигнал проще зафиксировать, чем сигнал от индивидульной молекулы. Однако, на каждом цикле определения нового нуклеотида, в части молекул происходит ошибочное включение или пропуск одного или нескольких нуклеотидов. Такое нарушение фазы приводит к накоплению уровня шума по мере секвенирования фрагмента. Этот эффект является причиной ошибок, а также ограничивает максимальный

размер секвенированной последовательности. Секвенаторы третьего поколения имеют более совершенные системы детекции сигнала, что поволяет им секвенировать одну единственную молекулу. Они лишены вышеуказанного недостатка секвенаторов второго поколения, а также требуют меньшего количества матрицы для секвенирования. Однако, эти технологии ещё недостаточно проработаны, и на сегодняшний день секвенаторы второго поколения занимают доминирующие позиции на рынке [8].

Представителями второго поколения ССП являются технологические платформы фирм Illumina (приборы Genome Analyzer Их, HiSeq2000, MiSeq), Roche (GS FLX Titanium, GS Junior) и Life Sciences (SOLiD и Ion Torrent PGM). Коммерческая платформа третьего поколения производится фирмой Pacific Biosciences (PacBio RS) [9].

Клональная амплификация фрагментов ДНК является ключевым этапом при подготовке образцов для секвенаторов 2 поколения. Для клональной амплификации используются два основных метода: эмульсионная ПЦР и твердофазная амплификация.

Для проведения эмульсионной ПЦР к фрагментам ДНК лигируются адаптеры, позволяющие амплифицировать всю библиотеку последовательностей с помощью универсальных праймеров. Затем фрагменты ДНК денатурируются в липидной эмульсии и гибридизуются с олигонуклеотидами, закреплёнными на специальных шариках. Условия подобраны таким образом, что формируются липидные капли, в которые заключено по одному шарику и одному гибридизованному фрагменту ДНК (рис. 1А). Затем следуют несколько циклов ПЦР, в которой матрицей служит фрагмент библиотеки, а праймером - олигонуклеотид, закреплённый на шарике. При этом липидная мембрана не даёт матрицам мигрировать от одного шарика к другому. После амплификации к каждому шарику оказываются прикреплены одинаковые фрагменты ДНК, комплементарные изначальному фрагменту библиотеки [10]. Эмульсионная ПЦР используется в приборах GS FLX Titanium и GS Junior (Roche), и в приборах Ion Torrent PGM и SOLiD (Life Sciences). В приборах GS FLX Titanium, GS Junior и Ion Torrent PGM шарики помещаются в лунки диаметром несколько микрометров, размещённые на специальных плашках [5, 11]. В каждой лунке оказываются идентичные последовательности, размещенные на одном шарике. В приборе SOLiD шарики закрепляются на поверхности стеклянной подложки на, расстоянии, достаточном, чтобы сигнал от разных шариков не перекрывался [12].

А.

ПЦР-эмульсия

\ Ш

Б.

% „

/

ДНК

фрагмент с адаптерами

Цикл ПЦР-амплификации

Шарик с продуктами ПЦР

Мостиковая амплификация

% Л - ^ ф-

I l Ni

Рис. 1. Принципы эмульсионной ПЦР и твердофазной амплификации [5].

При твердофазной амплификации к библиотеке фрагментов также лигируются адаптеры. Амплификация происходит на слайде, на котором с высокой плотностью расположены прямые и обратные праймеры для амплификации библиотеки (рис.1 Б). Фрагменты библиотеки гибридизуются с олигонуклеотидами на слайде. При этом концентрация фрагментов подобрана таким образом, чтобы расстояние между отдельными гибридизовавшимися фрагментами было достаточно велико. Затем следуют несколько раундов мостиковой амплификации, в результате которой образуются кластеры, каждый из которых состоит из множества идентичных молекул. Кластеры разделены пространствами, достаточными для того, чтобы сигналы, генерирующиеся при включении нуклеотидов, не перекрывались [5]. Этот принцип амплификации реализован в приборах фирмы Illumina.

Секвенирование и фиксирование информации о нуклеотидной последовательности. Для определения нуклеотидных последовательностей подготовленных фрагментов ДНК используется несколько различных подходов. Основные из них: циклическая обратимая терминация, секвенирование с помощью

лигирования, пиросеквенирование, ионное полупроводниковое секвенирование и мономолекулярное секвенирование в реальном времени.

Циклическая обратимая терминация. Метод циклической обратимой терминации используется в приборах фирмы Illumina. На каждом цикле секвенирования происходит определение одного нуклеотида из последовательности. В начале цикла ДНК-полимераза добавляет модифицированный нуклеотид, комплементарный матрице. Модифицированные нуклеотиды несут блокирующую группу на 3' конце, что обеспечивает включение только одного нуклеотида на каждом цикле, а также флуоресцентную группу, специфичную для каждого из четырёх азотистых оснований. После отмывки от не включившихся нуклеотидов, происходит сканирование флуоресценции со слайда, на котором расположены кластеры фрагментов ДНК. При этом, каждый из кластеров испускает флуоресценцию с длиной волны, соответствующей включенному нуклеотиду. Блокирующая группа и флуорофор удаляются, происходит промывка, и полимераза готова включить следующий нуклеотид [13]. Методики подготовки фрагментов ДНК и их секвенирования, применяемые в секвенаторах Illumina, обеспечивают большое количество прочтений длиной до 150 нуклеотидов при невысокой стоимости и среднем количестве ошибок (табл.1).

Секвенирование с помощью лигирования применяется в приборе SOLiD. Этот метод основан на способности ДНК-лигазы лигировать 5' и 3' концы двух олигонуклеотидов, гибридизовавшиеся на одноцепочечной матрице впритык друг к другу. В начале секвенирования двухцепочечная матрица денатурируется и с ней гибридизуется праймер для секвенирования. Затем с образовавшейся конструкцией гибридизуется набор частично вырожденных флуоресцентно-меченных олигонуклеотидов. В приборе SOLiD используются 8-звенные олигонуклеотиды, со случайными позициями 1, 2, 3 и 6, 7, 8, и тип флуоресцентной пробы, связанной с олигонуклеотидом определяется 4 и 5 неслучайными нуклеотидами. Когда с одноцепочечным фрагментом гибридизуется олигонуклеотид, имеющий 4 и 5 позиции, комплементарные матрице, происходит лигирование этого олигонуклеотида с праймером, отмывка от нелигировавшихся фрагментов и детекция флуоресценции. Затем происходит химическое разрезание модифицированной связи между 5 и 6 нуклеотидами, что приводит к удалению трёхнуклеотидного фрагмента и связанного с ним флуорофора. Это даёт возможность

повторить цикл лигирования несколько раз, получив информацию о 4 и 5, 9 и 10, 14и 15 и.т.д. нуклеотидах. После нескольких таких циклов, происходит денатурация, в результате которой снова получается одноцепочечный фрагмент матрицы. С ним гибридизуется новый прайм ер для секвенирования, 3' конец которого сдвинут на 1 позицию влево по сравнению с первым праймером для секвенирования. В этом раунде лигирований определяются последовательности 3 и 4, 8 и 9, 13 и 14 и.т.д. нуклеотидов. Путём модификации этой схемы определяются все позиции матрицы [12]. Особенностью такого подхода является то, что каждая позиция проверяется по два раза. Это обеспечивает высокую точность секвенирования и делает платформу SOLiD удобным инструментом для поиска однонуклетидных полиморфизмов. Недостатком является небольшая длина прочтения по сравнению с другими ССП (табл. 1).

Пиросеквенирование используется в приборах фирмы Roche. В основе этого метода лежит фиксация пирофосфата, выделяющегося при добавлении нуклеотида к строящейся цепи ДНК. Амплифицированные с помощью эмульсионной ПЦР фрагменты ДНК, закрепленные на шарике, помещаются в лунку на пикотитровальной плашке и инкубируются с ферментами: ДНК-полимеразой, АТФ-сульфурилазой, люциферазой и апиразой, и низкомолекулярными соединениями: аденозин-5'-фосфосульфатом (АФС) и люциферином. Плашка последовательно промывается раствором с одним из 4 нуклеотидов (вместо дАТФ используется его аналог, не являющийся субстратом для люциферазы). ДНК-полимераза достраивает нуклеотид, комплементарный матрице, при этом высвобождается пирофосфат. АТФ-сульфурилаза превращает пирофосфат в АТФ в присутствии АФС. Люцифераза использует энергию АТФ для преобразования люциферина в оксилюциферин, при этом выделяя свет. Наличие свечения свидетельствует о том, что нуклеотид включился в растущую цепь. Спустя некоторое время невключенные нуклеотиды разрушаются апиразой. При последовательной промывке каждым из четырех нуклеотидов, происходит постепенный синтез цепи ДНК, комплементарной матричной цепи. Если в матричной цепи присутствуют несколько одинаковых нуклеотидов, то синтез комплементарного участка происходит за один цикл промывки соответствующим нуклеотидом. Уровень свечения люциферазы до определённого предела соответствует количеству выделившегося пирофосфата, поэтому о количестве одинаковых нуклеотидов можно судить по интенсивности свечения [14]. Эта особенность методики приводит к

большому количеству ошибок при секвенировании участков, состоящих из нескольких одинаковых нуклеотидов (гомополимерных трактов) [12]. Методика пиросеквенирования обеспечивает достаточно протяженные прочтения, при этом процесс секвенирования занимает около суток. Недостатками таких секвенаторов является малое количество прочтений и высокая стоимость секвенирования (табл. 1).

Полупроводниковое секвенирование используется в приборе IonTorrent PGM. Принцип метода основан на детекции протонов, выделяющихся при включении нуклеотидов в растущую цепь ДНК. Как и в методике пиросеквенирования, фрагменты ДНК амплифицируются с помощью эмульсионной ПЦР и помещаются в лунки на плашке. В основании каждой лунки находится детектор изменения рН. Как и при пиросеквенировании, поверхность плашки последовательно промывается раствором с одним из нуклеотидов. При включении этого нуклеотида в растущую цепь, происходит выделение протонов, которое и детектируется. Общим недостатком с пиросеквенированием являются ошибки при чтении гомополимерных трактов. Вообще для прибора IonTorrent характерен относительно высокий уровень ошибок, а также небольшое количество прочтений. Эти недостатки компенсируются низкой стоимостью и быстротой секвенирования [13].

Мономолекулярное секвенирование в реальном времени. Эта методика, название которой в оригинале звучит как Single molecule real time sequencing (SMRT), используется в приборе PacBio RS. SMRT является секвенированием следующего поколения, то есть при секвенировании определяется нуклеотидная последовательность одного фрагмента. В основе метода лежит детекция флуоресценции нуклеотида, находящегося в активном центре ДНК-полимеразы, и готового включиться в строящуюся цепь. При этом используется модифицированная ДНК-полимераза, в которой нуклеотид задерживается в активном центре дольше, чем в обычном ферменте. Модифицированные нуклеотиды несут флуоресцентную группу, присоединенную к гамма-фосфату, поэтому при включении нуклеотида эта флуресцентная группа отделяется и переходит в раствор. Детекция флуоресценции единственной молекулы флуорофора оказывается возможной благодаря тому, что полимераза со связанной молекулой ДНК помещается в нано-технологическую структуру, называемую волноводом с нулевым колебанием (zero-mode waveguide, ZMW) [15]. Интересной особенностью метода является возможность

детектировать некоторые модификации азотистых оснований (например, Л/-6-метиладенин и У-метилцитозин), благодаря тому, что ДНК-полимераза притормаживает на таких нуклеотидах на больший промежуток времени. Это позволило определить полногеномные профили метилирования шести видов бактерий [16]. Методика Б МЯТ обеспечивает достаточно длинные прочтения от 300 до 20000 нуклеотидов. Недостатком метода является большое количество ошибок (> 10%)(табл. 1). Для уменьшения их количества к двухцепочечным фрагментам ДНК перед секвенированием лигируют специальные адаптеры, имеющие структуру шпилек. При денатурации этой конструкции образуются кольцевые одноцепочечные ДНК, имеющие структуру «адаптер - цепь Уотсона - адаптер -цепь Крика». При секвенировании таких конструкций, каждая из цепей секвенируется несколько раз. Таким способом удаётся уменьшить количество ошибок до уровня <3% [13].

Таким образом, на рынке представлено несколько различных технологий широкомасштабного секвенирования. Какие из них предпочтительны для изучения транскриптома бактерий? Для ответа на этот вопрос нужно обратиться к прикладным характеристикам секвенаторов следующего поколения (табл. 1). В том случае, когда секвенируется весь транскриптом бактериальной клетки требуется достаточно большой объём секвенирования. Действительно, длина бактериального генома обычно составляет 3 - 5 млн. нуклеотидов.

Длина прочтения, нукл. Объём сиквенса, млрд. нукл. Уровень ошибок, % Стоимость секвенирования 1 млн. нукл. Время секвенирования

GA Их до 150 30-40 0,76 $0,15 10 дней

HiSeq2000 до 150 600 0,26 $0,07 11 дней

GS FLX Titanium 700 0,7 од $10 24 часа

SOLiD v4 50 120 0,06 $0.13 7-14 дней

MiSeq до 150 2 0,8 $0.5 27 часов

IonTorrent PGM ~ 200 0,05-1 1,71 $1 2 часа

PacBio RS 1500 (средняя) од 12,86 $2 2 часа

Табл. 1: Прикладные характеристики наиболее распространенных моделей ССП.

Чтобы покрыть такой геном прочтениями несколько десятков раз, необходимо секвенировать 30-500 млн. нуклеотидов. Транскрипты разных генов представлены в транскриптоме крайне неравномерно. Поэтому, чтобы получить информацию о слабо представленных транскриптах, обычно требуется секвенировать 5-15 миллионов фрагментов, что соответствует сотням миллионов или нескольким миллиардам нуклеотидов [17]. Таким образом, количество прочтений является очень важным фактором при выборе прибора для секвенирования. Как правило, RNA-seq проводится для микроорганизмов с уже известным геномом, и прочтения картируются на уже известный геном. Поэтому обычно не требуется сборка длинных контигов из прочтений, и прочтения могут иметь небольшую длину. Учитывая эти два фактора, для профилирования полного транскиптома оптимальным выбором являются секвенаторы Illumina GAIIx и HiSeq2000, а также SOLiD v4.

Однако для изучения некоторых аспектов транскриптома не требуется секвенировать все молекулы РНК, присутствующие в клетке. Например, для поиска новых малых РНК иногда секвенируют только фракцию коротких РНК [18, 19], а для поиска точек начала транскрипции (ТНТ) иногда секвенируют только фрагменты РНК, примыкающие к ТНТ [20-22]. В этих случаях можно ограничиться меньшим количеством прочтений и исследователи могут выбирать любую из платформ. В большинстве подобных работ использовались приборы GS FLX Titanium, как появившиеся раньше всех и достаточно широко распространенные.

Длинные прочтения, генерируемые прибором PacBio RS, могут использоваться для изучения структуры оперонов у бактерий. Действительно, за одно прочтение может секвенироваться целая полицистронная мРНК, что позволит определить, какие гены входят в оперон. Однако подобные работы пока не публиковались.

Подготовка РНК к секвенированию

В общих чертах, подготовка РНК к секвенированию выглядит следующим образом: из бактериальных клеток выделяется тотальная фракция РНК. После выделения РНК обрабатывается ДНКазой для удаления следов геномной ДНК. Затем с тотальной РНК могут проводиться манипуляции, обогащающие её теми или иными интересующими нас фракциями. После этого РНК переводиться в кДНК с помощью обратной транскрипции

[23]. Самые распространенные на сегодняшний день ССП требуют, чтобы секвенируемые фрагменты кДНК содержали на своих концах адаптеры с известной последовательностью. Эти адаптеры могут быть лигированы к фрагментам кДНК, либо к молекулам РНК перед проведением обратной транскрипции [24].

Немаловажной проблемой при секвенировании бактериального транскриптома является очень малое содержание мРНК, которая может составлять лишь 1-5% от тотальной РНК [23]. Большую часть РНК бактериальной клетки составляет рРНК. Секвенирование тотальной РНК Prochlorococcus marinus, Escherichia coli и Rhodobacter sphaeroides продемонстрировало, что для всех трёх видов бактерий >98% прочтений картировалось в локус рРНК [25]. Таким образом, обогащение мРНК перед секвенированием является очень важной задачей. У эукариот все зрелые мРНК несут поли(А) хвост, благодаря которому они могут быть селективно отобраны. У прокариот полиаденилирование играет роль в деградации РНК и поли(А) хвосты распределены неравномерно, что делает невозможным такой путь обогащения [26, 27].

Было предложено несколько методик обогащения мРНК, и на основе некоторых из них были сделаны коммерческие наборы. Большая часть методик нацелена на селективное удаление рРНК. Коммерческие наборы MICROBExpress (Life Technologies) и Ribo-Zero (Epicentre) основаны на гибридизации олигонуклеотидов с консервативными районами рРНК и последующем удалении дуплексов из раствора с помощью магнитных шариков. Набор MICROBExpress появился раньше, и способен удалять 16S и 23 S рРНК, а более современный Ribo-Zero ещё и 5S рРНК. При сравнении этих двух наборов Ribo-Zero выглядит предпочтительнее: MICROBExpress не работает для бактерий, у которых последовательность участков рРНК не совпадает с олигонуклеотидами для гибридизации. Ribo-Zero использует более сложную систему для гибридизации, которая является коммерческой тайной. Благодаря этому Ribo-Zero работает для большего количества видов бактерий, а также способен удалять рРНК из частично деградировавшей тотальной РНК. Кроме того, Ribo-Zero удаляет более 99,9% рРНК, оставляя почти исключительно целевые последовательности. MICROBExpress не столь специфичен: после обработки в зависимости от вида бактерий от 70 до 90 процентов последовательностей составляют рРНК [25].

Наборы MICROBExpress и Ribo-Zero обеспечивают наилучшее обогащение мРНК [25]. Однако, другие методики также достойны упоминания. Набор mRNA-only (Epicentre) основан на селективной деградации молекул РНК, не несущих 5'-концевого трифосфата. Такая структура присуща только мРНК, а процессированные молекулы, такие как тРНК и рРНК имеют 5'-концевой монофосфат. Сходная методика применяется в подходе, называемом дифференциальное секвенирование РНК (differential RNA-seq, dRNA-seq), который описан в следующем разделе [28]. К сожалению, сравнительное исследование показало, что набор mRNA-only не смог уменьшить количество рРНК до уровня <70%, и, что хуже, исказил количественное соотношение мРНК разных генов [25].

В наборе Ovation (NuGEN) для затравки обратной транскрипции используется набор праймеров с особыми последовательностями, такими, чтобы кДНК не строилась из рРНК. Этот набор также не показал значительного снижения количества рРНК и привел к искажению транскрипционного профиля [25].

Интересным подходом для удаления рРНК является использование дуплекс-специфичной нуклеазы (ДСН) [29]. Этот термостабильный фермент расщепляет исключительно ДНК-ДНК или ДНК-РНК дуплексы. При синтезе кДНК вводятся адаптеры, позволяющие амплифицировать фрагменты с помощью пары одинаковых праймеров. После нескольких циклов амплификации дуплексы кДНК денатурируют нагреванием, добавляют ДСН и медленно понижают температуру. При этом последовательности рРНК, в силу своей большей представленности и единообразия гибридизуются быстрее, чем мРНК, что приводит к их расщеплению. При последующей амплификации с праймеров, комплементарных адаптерами, эти последовательности не амплифицируются, что и приводит к обогащению мРНК [30]. Эта методика позволяет уменьшить количество последовательностей рРНК до <10% у бактерий с невысоким ГЦ-составом генома. У видов с ГЦ-богатым геномом содержание последовательностей рРНК остаётся >80%. Вероятно, это связано с тем, что ГЦ-богатые последовательности мРНК гибридизуются лучше, чем последовательности рРНК со средним ГЦ-составом [25].

Модификации RNA-seq

Дифференциальное секвенирование РНК (differential RNA-seq, dRNA-seq). Одним из значительных преимуществ RNA-seq является возможность определить точки начала транскрипции (ТНТ) для всех транскрибирующихся генов. Классическими подходами для определения ТНТ являются методики достройки прайм ера и 5'RACE. Оба этих подхода достаточно трудоёмки и не могут использоваться для полногеномного анализа [28].

Бактериальный транскриптом состоит из первичных транскриптов, несущих на 5'-конце трифосфат и процессированных транскриптов, несущих на 5'-конце монофосфат или гидроксильную группу. Подход, называемый dRNA-seq, позволяет отличить первичные транскрипты от процессированных. Для этого используется 5'-фосфат-зависимая терминальная экзонуклеаза (terminal exonuclease, ТЕХ), которая селективно деградирует транскрипты, не имеющие 5'-трифосфата. Это приводит к обогащению пула РНК первичными транскриптами и обеднению процессированными транскриптами. рРНК по своей природе являются процессированными транскриптами, поэтому их содержание также понижается. В общем виде протокол dRNA-seq выглядит следующим образом [28, 31]:

Похожие диссертационные работы по специальности «Молекулярная биология», 03.01.03 шифр ВАК

Список литературы диссертационного исследования кандидат наук Игнатов, Дмитрий Васильевич, 2013 год

Список литературы

1. Febrer, M., et al., Advances in bacterial transcriptome and transposon insertion-site profiling using second-generation sequencing. Trends Biotechnol, 2011.29(11): p. 586-94.

2. Wang, Z., M. Gerstein, and M. Snyder, RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet, 2009. 10(1): p. 57-63.

3. Gehlenborg, N., et al., Visualization of omics data for systems biology. Nat Methods, 2010. 7(3 Suppl): p. S56-68.

4. Teusink, B., H. Bachmann, and D. Molenaar, Systems biology of lactic acid bacteria: a critical review. Microb Cell Fact, 2011. 10 Suppl 1: p. SI 1.

5. Metzker, M.L., Sequencing technologies - the next generation. Nat Rev Genet, 2010. 11(1): p. 31-46.

6. Lashkari, D.A., et al., Yeast microarrays for genome wide parallel genetic and gene expression analysis. Proc Natl Acad Sei USA, 1997. 94(24): p. 13057-62.

7. Liu, F., et al., Performance comparison of multiple microarray platforms for gene expression profiling Methods Mol Biol, 2012. 802: p. 141-55.

8. Quail, M.A., et al., A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics, 2012. 13: p. 341.

9. Liu, L., et al., Comparison of next-generation sequencing systems. J Biomed Biotechnol, 2012. 2012: p. 251364.

10. Williams, R., et al., Amplification of complex gene libraries by emulsion PCR. Nat Methods, 2006. 3(7): p. 545-50.

11. Rothberg, J.M., et al., An integrated semiconductor device enabling non-optical genome sequencing. Nature, 2011. 475(7356): p. 348-52.

12. Mardis, E.R., The impact of next-generation sequencing technology on genetics. Trends Genet, 2008.24(3): p. 133-41.

13. Mardis, E.R., Next-Generation Sequencing Platforms. Annu Rev Anal Chem (Palo Alto Calif), 2013.

14. Elahi, E. and M. Ronaghi, Pyrosequencing: a tool for DNA sequencing analysis. Methods Mol Biol, 2004. 255: p. 211-9.

15. Eid, J., et al., Real-time DNA sequencing from single polymerase molecules. Science, 2009. 323(5910): p. 133-8.

16. Murray, I.A., et al., The methylomes of six bacteria. Nucleic Acids Res, 2012. 40(22): p. 1145062.

17. Haas, B.J., et al., How deep is deep enough for RNA-Seq profiling of bacterial transcriptomes? BMC Genomics, 2012.13: p. 734.

18. Schlüter, J.P., et al., A genome-wide survey of sRNAs in the symbiotic nitrogen-fixing alpha-proteobacterium Sinorhizobium meliloti. BMC Genomics, 2010. 11: p. 245.

19. Acebo, P., et a!., Identification of 88 regulatory small RNAs in the TIGR4 strain of the human pathogen Streptococcus pneumoniae. RNA, 2012. 18(3): p. 530-46.

20. Jager, D., et al., Deep sequencing analysis of the Methanosarcina mazei Gol transcriptome in response to nitrogen availability. Proc Natl Acad Sei USA, 2009. 106(51): p. 21878-82.

21. Albrecht, M., et al., Deep sequencing-based discovery of the Chlamydia trachomatis transcriptome. Nucleic Acids Res, 2010. 38(3): p. 868-77.

22. Mitschke, J., et al., An experimentally anchored map of transcriptional start sites in the model cyanobacterium Synechocystis sp. PCC6803. Proc Natl Acad Sei U S A, 2011. 108(5): p. 2124-9.

23. Sorek, R. and P. Cossart, Prokaryotic transcriptomics: a new view on regulation, physiology and pathogenicity. Nat Rev Genet, 2010. 11(1): p. 9-16.

24. Levin, J.Z., et al., Comprehensive comparative analysis of strand-specific RNA sequencing methods. Nat Methods, 2010. 7(9): p. 709-15.

25. Giannoukos, G., et al., Efficient and robust RNA-seq process for cultured bacteria and complex community transcriptomes. Genome Biol, 2012. 13(3): p. 2012-13.

26. Mohanty, B.K. and S.R. Kushner, Bacterial/archaeal/organellarpolyadenylation. Wiley Interdiscip Rev RNA, 2011. 2(2): p. 256-76.

27. Lakey, D.L., et al., Priming reverse transcription with oligo(dT) does not yield representative samples of Mycobacterium tuberculosis cDNA. Microbiology, 2002. 148(Pt 8): p. 2567-72.

28. Borries, A., J. Vogel, and C.M. Sharma, Differential RNA Sequencing (dRNA-Seq): Deep-Sequencing-Based Analysis of Primary Transcriptomes, in Tag-Based Next Generation Sequencing. 2012, Wiley-VCH Verlag GmbH & Co. KGaA. p. 109-121.

29. Yi, H., et al., Duplex-specific nuclease efficiently removes rRNA for prokaryotic RNA-seq. Nucleic Acids Res, 2011. 39(20): p. el40.

30. Zhulidov, P.A., et al., Simple cDNA normalization using kamchatka crab duplex-specific nuclease. Nucleic Acids Res, 2004. 32(3): p. e37.

31. Schlüter, J.P., et al., Global mapping of transcription start sites and promoter motifs in the symbiotic alpha-proteobacterium Sinorhizobium meliloti 1021. BMC Genomics, 2013. 14: p. 156.

32. Sharma, C. and N. Heidrich, Small RNAs and virulence in bacterial pathogens. RNA Biol, 2012. 9(4): p. 361-3.

33. Vogel, J. and C.M. Sharma, How to find small non-coding RNAs in bacteria. Biol Chem, 2005. 386(12): p. 1219-38.

34. Bradley, E.S., et al., A genome-wide approach to discovery of small RNAs involved in regulation of virulence in Vibrio cholerae. PLoS Pathog, 2011. 7(7): p. el 002126.

35. Liu, J.M., et al., Experimental discovery of sRNAs in Vibrio cholerae by direct cloning, 5S/tRNA depletion and parallel sequencing. Nucleic Acids Res, 2009. 37(6): p. e46.

36. Mraheil, M.A., et al., The intracellular sRNA transcriptome of Listeria monocytogenes during growth in macrophages. Nucleic Acids Res, 2011. 39(10): p. 4235-48.

37. Yus, E., et al., Transcription start site associated RNAs in bacteria. Mol Syst Biol, 2012. 8: p. 585.

38. Liu, M.Y., et al., The RNA molecule CsrB binds to the global regulatory protein CsrA and antagonizes its activity in Escherichia coli. J Biol Chem, 1997. 272(28): p. 17502-10.

39. Sittka, A., et al., Deep sequencing analysis of small noncoding RNA and mRNA targets of the globalpost-transcriptional regulator, Hfq. PLoS Genet, 2008. 4(8): p. el000163.

40. Chao, Y. and J. Vogel, The role of Hfq in bacterial pathogens. Curr Opin Microbiol, 2010. 13(1): p. 24-33.

41. Dambach, M., I. Irnov, and W.C. Winkler, Association of RNAs with Bacillus subtilis Hfq. PLoS One, 2013. 8(2): p. e55156.

42. Li, S.K., et al., Identification of small RNAs in Mycobacterium smegmatis using heterologous Hfq. RNA, 2013. 19(1): p. 74-84.

43. Ingolia, N.T., et al., Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science, 2009. 324(5924): p. 218-23.

44. Ingolia, N.T., et al., The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nat Protoc, 2012. 7(8): p. 1534-50.

45. Oh, E., et al., Selective ribosome profiling reveals the cotranslational chaperone action of trigger factor in vivo. Cell, 2011. 147(6): p. 1295-308.

46. Li, G.W., E. Oh, and J.S. Weissman, The anti-Shine-Dalgarno sequence drives translational pausing and codon choice in bacteria. Nature, 2012. 484(7395): p. 538-41.

47. Zheng, W., L.M. Chung, and H. Zhao, Bias detection and correction in RNA-Sequencing data. BMC Bioinformatics, 2011. 12: p. 290.

48. Kozarewa, I., et al., Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes. Nat Methods, 2009. 6(4): p. 291-5.

49. Shiroguchi, K., et al., Digital RNA sequencing minimizes sequence-dependent bias and amplification noise with optimized single-molecule barcodes. Proc Natl Acad Sei U S A, 2012. 109(4): p. 1347-52.

50. Ozsolak, F., et al., Direct RNA sequencing. Nature, 2009. 461(7265): p. 814-8.

51. Ozsolak, F. and P.M. Milos, Single-molecule direct RNA sequencing without cDNA synthesis. Wiley Interdiscip Rev RNA, 2011. 2(4): p. 565-70.

52. Ozsolak, F. and P.M. Milos, Transcriptomeprofiling using single-molecule direct RNA sequencing. Methods Mol Biol, 2011. 733: p. 51-61.

53. Mamanova, L., et al., FRT-seq: amplification-free, strand-specific transcriptome sequencing. Nat Methods, 2010. 7(2): p. 130-2.

54. Mamanova, L. and DJ. Turner, Low-bias, strand-specific transcriptome Illumina sequencing by on-flowcell reverse transcription (FRT-seq). Nat Protoc, 2011. 6(11): p. 1736-47.

55. Oliver, H.F., et al., Deep RNA sequencing of L. monocytogenes reveals overlapping and extensive stationary phase and sigma B-dependent transcriptomes, including multiple highly transcribed noncoding RNAs. BMC Genomics, 2009.10: p. 641.

56. Frank, S., et al., Pseudomonas putida KT2440 genome update by cDNA sequencing and microarray transcriptomics. Environ Microbiol, 2011. 13(5): p. 1309-26.

57. Croucher, N.J., et al., A simple methodfor directional transcriptome sequencing using Illumina technology. Nucleic Acids Res, 2009. 37(22): p. el48.

58. Perkins, T.T., et al., A strand-specific RNA-Seq analysis of the transcriptome of the typhoid bacillus Salmonella typhi. PLoS Genet, 2009. 5(7): p. el000569.

59. Passalacqua, K.D., et al., Strand-specific RNA-seq reveals ordered patterns of sense and antisense transcription in Bacillus anthracis. PLoS One, 2012. 7(8): p. e43350.

60. Luo, G.X. and J. Taylor, Template switching by reverse transcriptase during DNA synthesis. J Virol, 1990.64(9): p. 4321-8.

61. Zhu, Y.Y., et al., Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. Biotechniques, 2001. 30(4): p. 892-7.

62. Adiconis, X., et al., Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nat Methods, 2013.

63. Ramskold, D., et al., Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells. Nat Biotechnol, 2012. 30(8): p. 777-82.

64. Filiatrault, M.J., et al., Transcriptome analysis of Pseudomonas syringae identifies new genes, noncoding RNAs, and antisense activity. J Bacteriol, 2010. 192(9): p. 2359-72.

65. Risso, D., et al., GC-content normalization for RNA-Seq data. BMC Bioinformatics, 2011. 12: p. 480.

66. Chen, Y.R., et al., A cost-effective method for Illumina small RNA-Seq library preparation using T4 RNA ligase 1 adenylated adapters. Plant Methods, 2012. 8(1): p. 41.

67. Flaherty, B.L., et al., Directional RNA deep sequencing sheds new light on the transcriptional response of Anabaena sp. strain PCC 7120 to combined-nitrogen deprivation. BMC Genomics, 2011. 12: p. 332.

68. Dotsch, A., et al., The Pseudomonas aeruginosa transcriptome in planktonic cultures and static biofilms using RNA sequencing. PLoS One, 2012. 7(2): p. 3.

69. Parkhomchuk, D., et al., Transcriptome analysis by strand-specific sequencing of complementary DNA. Nucleic Acids Res, 2009. 37(18): p. el23.

70. Mandlik, A., et al., RNA-Seq-based monitoring of infection-linked changes in Vibrio cholerae gene expression. Cell Host Microbe, 2011. 10(2): p. 165-74.

71. Weissenmayer, B.A., et al., Sequencing illustrates the transcriptional response of Legionella pneumophila during infection and identifies seventy novel small non-coding RNAs. PLoS One, 2011. 6(3): p. el7570.

72. Wurtzel, O., et al., A single-base resolution map of an archaeal transcriptome. Genome Res, 2010.20(1): p. 133-41.

73. Wurtzel, O., et al., Comparative transcriptomics of pathogenic and non-pathogenic Listeria species. Mol Syst Biol, 2012. 8: p. 583.

74. Wurtzel, O., et al., The single-nucleotide resolution transcriptome of Pseudomonas aeruginosa grown in body temperature. PLoS Pathog, 2012. 8(9): p. el002945.

75. Karunker, I., et al., A Global Transcriptional Switch between the Attack and Growth Forms of Bdellovibrio bacteriovorus. PLoS One, 2013. 8(4): p. e61850.

76. Oshlack, A., M.D. Robinson, and M.D. Young, From RNA-seq reads to differential expression results. Genome Biol, 2010. 11(12): p. 220.

77. Altschul, S.F., et al., Basic local alignment search tool. J Mol Biol, 1990. 215(3): p. 403-10.

78. Langmead, B., et al., Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol, 2009. 10(3): p. R25.

79. Li, R., et al., SOAP2: an improved ultrafast tool for short read alignment. Bioinformatics, 2009. 25(15): p. 1966-7.

80. Li, H. and N. Homer, A survey of sequence alignment algorithms for next-generation sequencing. Brief Bioinform, 2010. 11(5): p. 473-83.

81. Mortazavi, A., et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods, 2008. 5(7): p. 621-8.

82. Ji, Y., et al., BM-map: Bayesian mapping of multireads for next-generation sequencing data. Biometrics, 2011. 67(4): p. 1215-24.

83. Carver, T., et al., Artemis: an integrated platform for visualization and analysis of high-throughput sequence-based experimental data. Bioinformatics, 2012. 28(4): p. 464-9.

84. Nicol, J.W., et al., The Integrated Genome Browser: free software for distribution and exploration of genome-scale datasets. Bioinformatics, 2009. 25(20): p. 2730-1.

85. Yuan, M., et al., Genome sequence and transcriptome analysis of the radioresistant bacterium Deinococcus gobiensis: insights into the extreme environmental adaptations. PLoS One, 2012. 7(3): p. e34458.

86. Bullard, J.H., et al., Evaluation of statistical methods for normalization and differential expression in mRNA-Seq experiments. BMC Bioinformatics, 2010. 11: p. 94.

87. Gao, D., et al., A survey of statistical software for analysing RNA-seq data. Hum Genomics, 2010. 5(1): p. 56-60.

88. Hirano, T., et al., Deep sequencing of Porphyromonas gingivalis and comparative transcriptome analysis of a LuxS mutant. Front Cell Infect Microbiol, 2012. 2: p. 79.

89. Robinson, M.D., D.J. McCarthy, and G.K. Smyth, edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics, 2010. 26(1): p. 139-40.

90. Anders, S. and W. Huber, Differential expression analysis for sequence count data. Genome Biol, 2010. 11(10): p. R106.

91. Zeng, L., et al., Gene regulation by CcpA and catabolite repression explored by RNA-Seq in Streptococcus mutans. PLoS One, 2013. 8(3): p. e60465.

92. Li, J., et al., Normalization, testing, andfalse discovery rate estimation for RNA-sequencing data. Biostatisties, 2012. 13(3): p. 523-38.

93. Reiner, A., D. Yekutieli, and Y. Benjamini, Identifying differentially expressed genes using false discovery rate controlling procedures. Bioinformatics, 2003. 19(3): p. 368-75.

94. Huang da, W., B.T. Sherman, and R.A. Lempicki, Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc, 2009. 4(1): p. 44-57.

95. Subramanian, A., et al., Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sei USA, 2005. 102(43): p. 15545-50.

96. Tatusov, R.L., et al., The COG database: a tool for genome-scale analysis ofprotein functions and evolution. Nucleic Acids Res, 2000. 28(1): p. 33-6.

97. Ogata, H., et al., KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res, 1999. 27(1): p. 29-34.

98. Ashburner, M., et al., Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet, 2000. 25(1): p. 25-9.

99. Yoder-Himes, D.R., et al., Mapping the Burkholderia cenocepacia niche response via high-throughput sequencing. Proc Natl Acad Sei USA, 2009. 106(10): p. 3976-81.

100. Overbeek, R., et al., The subsystems approach to genome annotation and its use in the project to annotate 1000 genomes. Nucleic Acids Res, 2005. 33(17): p. 5691-702.

101. Tintie, N.L., et al., Evaluating the consistency of gene sets used in the analysis of bacterial gene expression data. BMC Bioinformatics, 2012. 13: p. 193.

102. Guell, M., et al., Transcriptome complexity in a genome-reduced bacterium. Science, 2009. 326(5957): p. 1268-71.

103. Koide, T., et al., Prevalence of transcription promoters within archaeal operons and coding sequences. Mol Syst Biol, 2009. 5: p. 285.

104. Pinto, A.C., et al., Application of RNA-seq to reveal the transcript profile in bacteria. Genet Mol Res, 2011. 10(3): p. 1707-18.

105. Toledo-Arana, A., et al., The Listeria transcriptional landscape from saprophytism to virulence. Nature, 2009. 459(7249): p. 950-6.

106. Qiu, Y., et al., Structural and operational complexity of the Geobacter sulfurreducens genome. Genome Res, 2010.20(9): p. 1304-11.

107. Cho, B.K., et al., The transcription unit architecture of the Escherichia coli genome. Nat Biotechnol, 2009. 27(11): p. 1043-9.

108. Breaker, R.R., Prospects for riboswitch discovery and analysis. Mol Cell, 2011. 43(6): p. 867-79.

109. Mitschke, J., et al., Dynamics of transcriptional start site selection during nitrogen stress-induced cell differentiation in Anabaena sp. PCC7120. Proc Natl Acad Sei U S A, 2011. 108(50): p. 20130-5.

110. Filiatrault, M.J., et al., Genome-wide identification of transcriptional start sites in the plant pathogen Pseudomonas syringaepv. tomato str. DC3000. PLoS One, 2011. 6(12): p. e29335.

111. Dornenburg, J.E., et al., Widespread antisense transcription in Escherichia coli. MBio, 2010. 1(1).

112. Hovik, H., et al., Comprehensive transcriptome analysis of the periodontopathogenic bacterium Porphyromonas gingivalis W83. J Bacteriol, 2012. 194(1): p. 100-14.

113. Lasa, I., A. Toledo-Arana, and T.R. Gingeras, An effort to make sense of antisense transcription in bacteria. RNA Biol, 2012. 9(8): p. 1039-44.

114. Lasa, I., et al., Genome-wide antisense transcription drives mRNA processing in bacteria. Proc Natl Acad Sei U S A, 2011. 108(50): p. 20172-7.

115. Liu, B. and B.M. Alberts, Head-on collision between a DNA replication apparatus and RNA polymerase transcription complex. Science, 1995. 267(5201): p. 1131-7.

116. Arnvig, K.B. and D.B. Young, Identification of small RNAs in Mycobacterium tuberculosis. Mol Microbiol, 2009. 73(3): p. 397-408.

117. Ignatov, D.V., et al., [Identified small RNAs of Mycobacterium avium]. Bioorg Khim, 2012. 38(4): p. 509-12.

118. Livny, J., Bioinformatic discovery of bacterial regulatory RNAs using SIPHT. Methods Mol Biol, 2012.905: p. 3-14.

119. DiChiara, J.M., et al., Multiple small RNAs identified in Mycobacterium bovis BCG are also expressed in Mycobacterium tuberculosis and Mycobacterium smegmatis. Nucleic Acids Res, 2010. 38(12): p. 4067-78.

120. Miotto, P., et al., Genome-wide discovery of small RNAs in Mycobacterium tuberculosis. PLoS One, 2012. 7(12): p. e51950.

121. Pellin, D., et al., A genome-wide identification analysis of small regulatory RNAs in Mycobacterium tuberculosis by RNA-Seq and conservation analysis. PLoS One, 2012. 7(3): p. e32723.

122. Arnvig, K.B., et al., Sequence-based analysis uncovers an abundance of non-coding RNA in the total transcriptome of Mycobacterium tuberculosis. PLoS Pathog, 2011. 7(11): p. el 002342.

123. Ramachandran, V.K., et al., The architecture and ppGpp-dependent expression of the primary transcriptome of Salmonella Typhimurium during invasion gene expression. BMC Genomics, 2012. 13: p. 25.

124. Storz, G., J. Vogel, and K.M. Wassarman, Regulation by small RNAs in bacteria: expanding frontiers. Mol Cell, 2011. 43(6): p. 880-91.

125. Wassarman, K.M., 6S RNA: a small RNA regulator of transcription. Curr Opin Microbiol, 2007. 10(2): p. 164-8.

126. Babitzke, P. and T. Romeo, CsrB sRNA family: sequestration of RNA-binding regulatory proteins. Curr Opin Microbiol, 2007. 10(2): p. 156-63.

127. Arnvig, K. and D. Young, Non-coding RNA and its potential role in Mycobacterium tuberculosis pathogenesis. RNA Biol, 2012. 9(4): p. 427-36.

128. Weinberg, Z., et al., Identification of 22 candidate structured RNAs in bacteria using the CMfinder comparative genomics pipeline. Nucleic Acids Res, 2007. 35(14): p. 4809-19.

129. Belisle, J.T. and M.G. Sonnenberg, Isolation of genomic DNA from mycobacteria. Methods Mol Biol, 1998. 101: p. 31-44.

130. Rio, D.C., et al., Polyacrylamide gel electrophoresis of RNA. Cold Spring Harb Protoc, 2010. 2010(6): p. pdb prot5444.

131. Langmead, B. and S.L. Salzberg, Fast gapped-read alignment with Bowtie 2. Nat Methods, 2012. 9(4): p. 357-9.

132. Kurtz, S., et al., Versatile and open software for comparing large genomes. Genome Biol, 2004. 5(2): p. 30.

133. Bailey, T.L. and C. Elkan, Fitting a mixture model by expectation maximization to discover motifs in biopolymers. Proc Int Conf Intell Syst Mol Biol, 1994. 2: p. 28-36.

134. Turenne, C.Y., et al., Mycobacterium avium subsp. paratuberculosis andM. avium subsp. avium are independently evolved pathogenic clones of a much broader group of M. avium organisms. J Bacteriol, 2008. 190(7): p. 2479-87.

135. Dvorska, L., et al., A standardised restriction fragment length polymorphism (RFLP) method for typing Mycobacterium avium isolates links IS901 with virulence for birds. J Microbiol Methods, 2003. 55(1): p. 11-27.

136. Harris, N.B. and R.G. Barletta, Mycobacterium avium subsp. paratuberculosis in Veterinary Medicine. Clin Microbiol Rev, 2001. 14(3): p. 489-512.

137. Falkinham, J.O., The changing pattern of nontuberculous mycobacterial disease. Can J Infect Dis, 2003. 14(5): p. 281-6.

138. Guerin, I. and C. de Chastellier, Pathogenic mycobacteria disrupt the macrophage actin filament network. Infect Immun, 2000. 68(5): p. 2655-62.

139. Appelberg, R., Pathogenesis of Mycobacterium avium infection: typical responses to an atypical mycobacterium? Immunol Res, 2006. 35(3): p. 179-90.

140. Kondratieva, E.V., et al., I/St mice hypersusceptible to Mycobacterium tuberculosis are resistant to M. avium. Infect Immun, 2007. 75(10): p. 4762-8.

141. Janagama, H.K., et al., Primary transcriptomes of Mycobacterium avium subsp. paratuberculosis reveal proprietary pathways in tissue and macrophages. BMC Genomics, 2010. 11: p. 561.

142. Mandal, M. and R.R. Breaker, Gene regulation by riboswitches. Nat Rev Mol Cell Biol, 2004. 5(6): p. 451-463.

143. Alexander, D.C., C.Y. Turenne, and M.A. Behr, Insertion and deletion events that define the pathogen Mycobacterium avium subsp. paratuberculosis. J Bacteriol, 2009. 191(3): p. 1018-25.

144. Bailly-Bechet, M., M. Vergassola, and E. Rocha, Causes for the intriguing presence of tRNAs in phages. Genome Res, 2007. 17(10): p. 1486-95.

145. Pandey, A.K. and C.M. Sassetti, Mycobacterial persistence requires the utilization of host cholesterol. Proc Natl Acad Sci USA, 2008. 105(11): p. 4376-80.

146. Mohn, W.W., et al., The actinobacterial mce4 locus encodes a steroid transporter. J Biol Chem, 2008. 283(51): p. 35368-74.

147. Milon, P. and M.V. Rodnina, Kinetic control of translation initiation in bacteria. Crit Rev Biochem Mol Biol, 2012. 47(4): p. 334-48.

148. Gardner, P.P., et al., Rfam: updates to the RNA families database. Nucleic Acids Res, 2009. 37(Database issue): p. 25.

149. Weinberg, Z., et al., The aptamer core of SAM-IVriboswitches mimics the ligand-binding site of SAM-Iriboswitches. Rna, 2008. 14(5): p. 822-8.

150. Dann, C.E., 3rd, et al., Structure and mechanism of a metal-sensing regulatory RNA. Cell, 2007. 130(5): p. 878-92.

151. Akhter, Y., et al., The PE/PPE multigene family codes for virulence factors and is a possible source of mycobacterial antigenic variation: perhaps more? Biochimie, 2012. 94(1): p. 110-6.

152. Sandra L, W., From the elephant to E. coli: SRP-dependentprotein targeting. Cell, 1994. 77(6): p. 787-790.

153. Masquida, B. and E. Westhof, RNase P: at last, the key finds its lock. RNA, 2011. 17(9): p. 16158.

154. Torarinsson, E. and S. Lindgreen, WAR: Webserver for aligning structural RNAs. Nucleic Acids Res, 2008. 36(Web Server issue): p. 20.

155. Okonechnikov, K., O. Golosova, and M. Fursov, Unipro UGENE: a unified bioinformatics toolkit. Bioinformatics, 2012. 28(8): p. 1166-7.

156. Forbes, J.R. and P. Gros, Divalent-metal transport by NRAMP proteins at the interface of host-pathogen interactions. Trends Microbiol, 2001. 9(8): p. 397-403.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.