Комбинирование биоинформатических подходов для de novo сборки сложных геномов на примере миниатюрного паразитоида Megaphragma amalphitanum и вымершей стеллеровой коровы Hydrodamalis gigas. тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Шарко Федор Сергеевич
- Специальность ВАК РФ00.00.00
- Количество страниц 203
Оглавление диссертации кандидат наук Шарко Федор Сергеевич
ОГЛАВЛЕНИЕ
СПИСОК СОКРАЩЕНИЙ
ВВЕДЕНИЕ
Актуальность работы
Цели и задачи
Научные положения выносимые на защиту
Степень разработанности темы исследования
Научная новизна, теоретическая и практическая значимость работы
Личный вклад автора
Степень достоверности и апробация результатов
Публикации по теме диссертации
Структура и объем работы
ОБЗОР ЛИТЕРАТУРЫ
1.1. Биологическое описание объектов исследования
1.1.1. Стеллерова корова, Hydrodamalis gigas
1.1.2. Миниатюрный паразитоидный наездник Megaphragma amalphitanum
1.2. Что такое секвенирование ДНК
1.2.1 Технология секвенирования на молекулярных кластерах с использованием
флуоресцентно меченых нуклеотидов Illumina
1.2.2 Технология нанопорового секвенирования
1.3. Древняя ДНК и палеогеномика
1.3.1 Оценка посмертных повреждений в древней ДНК
1.3.2 Древние патогены
1.3.2.1. Программы для поиска древних патогенов
1.4. Сборка геномов de novo
1.4.1. Сборка геномов de novo с помощью коротких ДНК-прочтений
1.4.2. Подход на основе графов де Брейна
1.4.3. Потенциальные проблемы в сборке коротких прочтений de novo
1.4.4.1. ALLPATHS-LG
1.4.4.2. SOAPdenovo
1.4.4.3. SparseAssembler
1.4.4.4. SGA
1.4.4.5. MaSuRCA
1.4.4.6. Meraculous
1.4.4.7. Velvet
1.4.4.8. SPAdes
1.4.4.9. ABySS
1.4.5. Сборка de novo с помощью длинных прочтений
1.4.5.1. Гибридная сборка de novo геномов
1.4.5.2. Сборка de novo генома только длинными ДНК-прочтениями
1.4.5.3. Подход de novo сборки геномов, основанный на перекрытии
1.5.1 Аннотация генома собранного de novo
1.5.1.1. Выявление некодирующих участков генома
1.5.1.2. Определение белок-кодирующих генов в геноме собранном de novo
1.5.1.3. Функциональная аннотация генома собранного de novo
1.5.1.4. Автоматические системы аннотации эукариотических геномов
1.5.1.5. Инструменты для оценки геномных сборок
1.6.1 Анализ демографической истории вида
2. Стеллерова корова H. gigas
2.1. МЕТОДЫ
2.1.1. Материал, использованный в работе
2.1.1. Выделение исторической ДНК, приготовление ДНК-библиотек и секвенирование61
2.1.2. Секвенирование ДНК-библиотек, приготовленных из образца плечевой кости (14574) и анализ данных секвенирования
2.1.3. Тестовое секвенирование ДНК-библиотек, приготовленных из образца каменистой кости (Ber/07/Yk-1), и анализ данных секвенирования
2.1.4. Глубокое секвенирование ДНК-библиотек, приготовленных из образца каменистой кости (Ber/07/Yk-1), и анализ данных секвенирования
2.1.5. Поиск однонуклеотидных полиморфизмов (SNPs, ОП) в геноме стеллеровой коровы (образец Ber/07/Yk-1) и анализ гетерозиготности
2.1.6. Анализ положительного отбора в геноме стеллеровой морской коровы (образец Ber/07/Yk-1)
2.1.7. De novo сборка генома стеллеровой коровы (образец Ber/07/Yk-1)
2.1.8. Определение пола образца морской коровы (образец Ber/07/Yk-1)
2.1.9. Филогенетический анализ на основе полных митохондриального геномов стеллеровой коровы (образцы 14574 и Ber/07/Yk-1)
2.1.10. Филогенетический анализ стеллеровой коровы (образец Ber/07/Yk-1) на основе ядерного генома
2.1.11. Оценка скорости мутаций в геноме стеллеровой коровы (образец Ber/07/Yk-1)
2.1.12. Анализ демографической структуры стеллеровой коровы (образец Ber/07/Yk-1)
2.2. РЕЗУЛЬТАТЫ
2.2.1. Статистика секвенирования стеллеровой коровы (образец 14574), сборка митохондриального генома и его характеристика
2.2.1. Статистика секвенирования стеллеровой коровы (образец Ber/07/Yk-1)
2.2.2 Сохранность ДНК образцов стеллеровой коровы (образец Ber/07/Yk-i)
2.2.3. Поиск однонуклеотидных полиморфизмов (SNPs, ОП) и анализ гетерозиготности в геноме стеллеровой коровы (образец Ber/07/Yk-i)
2.2.4 Анализ положительного отбора в геноме стеллеровой морской коровы (образец Ber/07/Yk-i)
2.2.5. De novo сборка митохондриального и ядерного геномов стеллеровой морской коровы (образец Ber/07/Yk-i)
2.2.6 Определение пола образца морской коровы (образец Ber/07/Yk-i)
2.2.7 Филогенетический анализ на основе ядерного (образец Ber/07/Yk-1) и митохондриальных геномов (образцы Ber/07/Yk-1 и 14574)
2.2.8 Демографическая структура командорской популяции стеллеровой коровы, на основе геномных данных
2.3 ОБСУЖДЕНИЕ
3. Паразитоидный наездник M. amalphitanum
3.1.МЕТОДЫ
3.1.1. Выделение ДНК из тканей паразитоидного наездникаMegaphragma amalphitanum, создание геномных ДНК библиотек и их секвенирование
3.1.2. Выделение тотальной РНК из тканей паразитоидного наездника Megaphragma amalphitanum, создание кДНК библиотеки и секвенирование
3.1.3. Выделение ДНК из тканей жука-перокрылки Scydosella musawasensis, создание геномной ДНК библиотеки и ее секвенирование
3.1.4. Сборка de novo ядерного генома паразитоидного наездника Megaphragma amalphitanum
3.1.5. Сборка и аннотация митохондриального генома паразитоидного наездника Megaphragma amalphitanum. Филогенетический анализ
3.1.6. Сборка и аннотация митохондриального генома жука-перокрылки Scydosella musawasensis. Филогенетический анализ
3.1.7. Порядок митохондриальных генов как дополнительный маркер в филогенетических исследованиях насекомых
3.1.8. Сборка de novo транскриптомов паразитоидного наездника Megaphragma amalphitanum и паразитического наездника Ceratosolen solmsi
3.1.9. Анализ генных онтологий и аннотация транскриптомов Megaphragma amalphitanum, Ceratosolen solmsi, Diachasma alloeum, Fopius arisanus, Cotesia vestalis и Trichogramma pretiosum. Сравнительный анализ генной экспрессии
3.1.10. Поиск потенциально отсутствующих и/или быстро эволюционирующих генов/групп генов в геноме Megaphragma amalphitanum
3.1.11. Поиск генов хеморецепторов в геноме паразитоидного наездника Megaphragma amalphitanum..............................................................................................................................9i
3.1.12. Идентификация и анализ мобильных элементов (TE-элементов) в геноме паразитоидного наездника Megaphragma amalphitanum.......................................................9i
3.1.13. Поиск вирусов ассоциированных с паразитоидным наездником Megaphragma amalphitanum
3.1.14. Поиск компонентов яда в транскриптоме паразитоидного наездника Megaphragma
amalphitanum
3.1.15. Метагеномный анализ паразитоидного наездника Megaphragma amalphitanum .... 94 3.2. РЕЗУЛЬТАТЫ
3.2.1. Сборка митохондриального генома паразитоидного наездника Megaphragma amalphitanum
3.2.2. Сборка митохондриального генома жука-перокрылки Scydosella musawasensis
3.2.3. Сборка генома и транскриптома паразитоидного наездника Megaphragma amalphitanum
3.2.4. Анализ генных онтологий в транскриптоме паразитоидного наездника Megaphragma amalphitanum
3.2.5. Поиск потенциально отсутствующих генов и / или быстро эволюционирующих кластеров генов в геноме Megaphragma amalphitanum
3.2.6. Поиск генов хеморецепторов у Megaphragma amalphitanum
3.2.7. Поиск компонентов яда в транскриптоме Megaphragma amalphitanum
3.2.8. Виром паразитоидного наездника Megaphragma amalphitanum
3.2.9. Мобильные элементы в геноме паразитоидного наездника Megaphragma amalphitanum
3.2.10. Метагеном паразитоидного наездника Megaphragma amalphitanum
3.2.11. Характеристика генов, кодирующих белки теплового шока - hsp70 в геноме паразитоидного наездникаM. amalphitanum. Филогенетический анализ генов hsp70
3.2.12. Характеристика генов, кодирующих белки теплового шока - hsp83 в геноме паразитоидного наездника M. amalphitanum
3.2.13. Порядок митохондриальных генов как дополнительный маркер в филогенетических исследованиях насекомых
3.3. ОБСУЖДЕНИЕ
ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ H. Gigas
МЕТОДЫ
Подбор метода для выделения и подготовки библиотек из древней ДНК
ТАБЛИЦЫ
РИСУНКИ
ПРИЛОЖЕНИЕ Megaphragma amalphitanum
ТАБЛИЦЫ
РИСУНКИ
СПИСОК СОКРАЩЕНИЙ
a^R - ancient DNA, древняя ДНК
NGS- next generation sequencing, секвенирование нового поколения
SNP- однонуклеотидный полиморфизм, ОНП
тРНК - Транспортная РНК
рРНК - Рибосомальная РНК
ед. - единица
млн - миллион
мтДНК- митохондриальная ДНК
CDS - Белок-кодирующие последовательности
п.н. - пара нуклеотидов
ПЦР - полимеразная цепная реакция
МГЭ - Мобильные генетические элементы
TE - transposable elements, мобильные элементы
GO - Генная онтология
тыс. лет- тысяч лет
ВВЕДЕНИЕ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Структура и эволюция митохондриального генома реликтовых пиявок2022 год, кандидат наук Болбат Александр Васильевич
«Геномный анализ представителей семейства куньих (Mustelidae)»2022 год, кандидат наук Манахов Андрей Дмитриевич
Сравнительный анализ митохондриальной ДНК древних и современных представителей крупных млекопитающих Западной Сибири2022 год, кандидат наук Молодцева Анна Сергеевна
Сборка и аннотация генома африканского гепарда, Acinonux jubatus2022 год, кандидат наук Добрынин Павел Владимирович
Аннотация генома и предсказание сайтов начала транскрипции для лиственницы сибирской (Larix sibirica Ledeb)2024 год, кандидат наук Бондар Евгения Ивановна
Введение диссертации (часть автореферата) на тему «Комбинирование биоинформатических подходов для de novo сборки сложных геномов на примере миниатюрного паразитоида Megaphragma amalphitanum и вымершей стеллеровой коровы Hydrodamalis gigas.»
Актуальность работы
Появление высокопроизводительных технологий секвенирования ДНК и РНК сопровождается развитием в области программного обеспечения, создаются алгоритмы с открытым программным кодом, а также открытые источники данных и платформы для вычислений. Новые математические и информационные технологии позволяют геномике развиваться быстрее и использовать более сложные алгоритмы. C появлением секвенирования нового поколения (next-generation sequencing, NGS) и одномолекулярного секвенирования процесс определения полной последовательности генома ускорился и подешевел. De novo секвенирование и сборка новых для науки геномов c использованием только коротких ДНК прочтений сильно затрудняет биоинформатический анализ, особенно в случае больших и сложных эукариотических геномов (например, полиплоидных). В таких случаях в последнее время применяется гибридный подход, в котором комбинируются короткие и длинные ДНК прочтений, сгенерированные разными платформами для секвенирования. Комбинирование технологических платформ для ДНК секвенирования, а также методы гибридной сборки позволяют успешно реконструировать геномы до уровня хромосом. В то же время в некоторых случаях даже такие подходы не всегда позволяют эффективно собирать новые геномы. В первую очередь это относится к геномам миниатюрных и некультивируемых организмов, а также к геномам вымерших видов (палеогеномам). В случае миниатюрных организмов у исследователя зачастую возникают трудности при экстракции генетического материала в достаточном количестве и поэтому возможность покрыть весь геном длинными ДНК прочтениями у него отсутствует. В случае палеогеномов, присутствуют не только трудности связанные с невозможностью выделения ДНК в достаточном для пробоподготовки количестве, но и проблема её деградации, а также контаминация современным
генетическим материалом. Поэтому в таких частных случаях биоинформатический анализ и сборка геномов требуют специфических подходов. В то же время сборка даже драфтовых геномов позволяет проверять эволюционные и популяционные гипотезы применимо к этим видам и их сородичам.
В данной работе на примере миниатюрного паразититоидного наездника (Megaphragma amalphitanum [1]) мы отработали спектр методов сборки ядерного генома насекомого, чей размер значительно уменьшился в процессе эволюции. Миниатюризация организмов - одно из интереснейших эволюционных явлений, которое широко представлено среди многоклеточных организмов как беспозвоночных (немертины, круглые черви, брахиоподы, моллюски, паукообразные и насекомые), так и позвоночных (рыбы, амфибии, птицы и даже млекопитающие) [2]. Миниатюризация приводит к значительному сокращению размеров организма и упрощению ряда систем и органов, без потери жизнеспособности. Как правило, эта комплексная эволюционная модификация связана с занятием особой экологической ниши свободной от конкурентов. Понимание процесса эволюционной миниатюризации многоклеточных организмов имеет колоссальное фундаментальное значение. Для позвоночных показано, что миниатюризация приводит к изменениям в анатомии и скелете, у беспозвоночных изменения связанные с уменьшением размеров тела еще более катастрофичны, затрагивая многие органы и системы органов [3,4]. Миниатюризация иногда может приводить к изменению структуры и размеров генома и, как следствие, изменению экспрессии определенных генов, связанных с ростом и развитием организма [5].
Миниатюризация органов и систем органов часто встречается среди членистоногих, в частности, у насекомых. Паразитоидный наездник M. amalphitanum считается одним из наиболее миниатюрных насекомых, описанных к настоящему времени, и его размер сопоставим с одноклеточными
организмами (длина взрослой особи 250 мкм). Процессы миниатюризации привели к значительным значительным преобразованиям не только на уровне органов, но и на клеточном уровне - часть нейронов центральной нервной системы (ЦНС) у M. amalphitanum безъядерные. Виды рода Megaphragma паразитируют на оранжерейных трипсах Heliothrips haemorrhoidalis и проводят большую часть своего жизненного цикла в яйцах хозяина, а стадия имаго длится всего несколько дней [1,6].
Еще одним объектом исследования в данной работе, на котором был также отработаны методы сборки ядерного генома, стала стеллерова корова (Hydrodamalis gigas Zimmermann, 1780). Стеллерова корова — вымершее к настоящему времени животное из отряда сирен (Sirenia), который включает в себя четыре вида млекопитающих — дюгоня (Dugong dugon Statius Müller, 1776), а также американского (Trichechus manatus Linnaeus, 1758), амазонского (T. inunguis Natterer, 1883) и африканского (T. senegalensis Link, 1795) ламантинов, населяющих теплые воды Тихого, Индийского и Атлантического океанов. В отличие от своих сородичей, стеллерова корова обитала в холодных прибрежных водах северной части Тихого океана в плейстоцене и голоцене, и имела ряд физиологических и морфологических адаптаций к суровым условиям обитания, в том числе к питанию бурыми водорослями. Согласно палеобиологическим исследованиям, этот вид процветал в эпоху плейстоценовых оледенений, однако затем, по-видимому, из-за подъёма уровня Мирового океана его ареал значительно фрагментировался. Последняя популяция стеллеровых коров была описана у побережья Командорских островов Георгом Стеллером - участником Второй Камчатской экспедиции Витуса Беринга (1740—1742). Спустя несколько десятилетий этот вид был полностью уничтожен промышленниками, высоко ценившими стеллеровых коров, как источник мяса и жира.
Возможность использования ДНК из музейных образцов позволяет решать задачи, связанные с эволюцией экосистем в различных условиях, а
современные методы геномики позволяют оценить размер популяций хозяйственно ценных видов организмов, подорванных деятельностью человека. Имеющиеся достижения в области выделения ДНК из музейного материала, геномики и биоинформатики позволяют более детально описать эволюцию видов с учетом различных адаптаций, приобретённых популяциями.
Цели и задачи.
Разработка и применение биоинформатических методов сборки "сложных" геномов миниатюрных, некультивируемых организмов, а также вымерших видов.
Megaphragma amalphitanum. Изучение генетических аспектов миниатюризации M. amalphitanum c использованием современных биоинформационных подходов.
Hydrodamalis gigas. Использование современных биоинформационных подходов для изучения причин и времени вымирания стеллеровой коровы.
В связи с этим были поставлены следующие задачи:
Megaphragma amalphitanum:
1. Собрать de novo транскриптом, ядерный и митохондриальный геномы M. amalphitanum и провести их аннотацию;
2. Провести анализ филогенетического положения M. amalphitanum, используя порядок генов и последовательности белок-кодирующих генов в митохондриальном вида;
3. Провести биоинформатический анализ генома M. amalphitanum по сравнению с геномами других, более крупных представителей отряда Hymenoptera с целью выявления локусов, потенциально связанных с миниатюризацией у перепончатокрылых;
4. Выявить виды/штаммы бактерий-симбионтов паразитоидного наездника M. amalphitanum.
Hydrodamalis gigas:
5. Собрать de novo ядерный и митохондриальный геномы H. gigas и провести их аннотацию;
6. Провести анализ филогенетического положения H. gigas, используя последовательности белок-кодирующих генов митохондриального генома;
7. Описать гены, находившиеся под положительным отбором в геноме стеллеровой коровы;
8. Описать демографическую историю вида H. gigas и оценить уровень гетерозиготности его последней популяции на Командорских островах.
Научные положения выносимые на защиту
Отсутствие корреляции между размером тела паразитоида и размером его генома (346 млн. п. н.) при сопоставлении с более крупным наездником насонией, Nasonia vitripennis (размер генома - 295 млн. п. н.) и медоносной пчелой, Apis mellifera (размер генома - 247 млн. п. н.).
Описано 78 генов, по-видимому, отсутствующих (или быстро эволюционирующих) в геноме M. amalphitanum по сравнению с ближайшими, более крупными представителями отряда Hymenoptera, среди них - ген, кодирующий центросомин (cnn). Предполагается, что это связано с обнаруженным ранее отсутствием клеточного ядра в нейронах ЦНС у M. amalphitanum .
В геноме M. amalphitanum не выявлена вспышка активности мобильных элементов в последние миллионы лет эволюции, что может быть связано с отсутствием бактерии Wolbachia в микробиоме этого паразитоидного наездника.
Продемонстрировано отсутствие влияния миниатюризации на состав хеморецепторов у M. amalphitanum. Более того, наиболее консервативный ко-рецептор ORCO, идентифицированный у разнообразных представителей отрядов Díptera, Coleoptera, Hymenoptera, Lepidoptera и Hemiptera, также обнаружен нами у M. amalphitanum.
Командорская популяция стеллеровой коровы так же как и последняя популяция шерстистых мамонтов (остров Врангеля) обладала пониженной гетерозиготностью и, возможно, несмотря на относительно солидный размер (около 2000 особей), находилась на грани исчезновения к моменту прибытия на острова Второй Камчатской экспедиции Витуса Беринга (1740—1742). Окончательное вымирание вида напрямую связано с хозяйственной деятельностью человека, который окончательно уничтожил стеллерову корову через несколько десятилетий после её описания.
Степень разработанности темы исследования
Megaphragma amalphitanum. Размер тела организма зачастую считается одной из важнейших его особенностей: его увеличение предоставляет значительное число преимуществ, хотя и имеет определенные минусы. Кроме постепенного увеличения размеров тела в эволюции присутствует и обратный процесс - миниатюризация систем и органов приводящий к морфологической и физиологической деградации организма. Постепенное уменьшение размеров тела в процессе эволюции широко представлено среди многих таксонов животных как среди позвоночных, так и беспозвоночных [2].
Молекулярные механизмы, влияющие на рост, развитие и размеры организма, его органов и тканей, заложены в его геноме и прошли жесткий естественный отбор. Известно, что многие из них имеют гормональную природу у животных. У насекомых размеры тела имаго напрямую связаны с уровнем стероидных гормонов экдизонов в течение личиночной стадии. Изменение концентрации гормонов останавливает рост и развитие личинки и
приводит к началу метаморфозов во взрослую особь [7]. Размеры организма зависят также и от других факторов, в которые задействована целая плеяда молекулярных и физиологических механизмов, которые контролируют рост развитие тканей и органов, более того, влияют на их структуру. Центральная нервная система паразититоидного наездника M. amalphitanum значительно упрощена и только 339 - 372 её нейронов имеют клеточные ядра, в то время как остальные теряют их на стадии куколки. Потеря клеточных ядер не сказывается на жизнеспособности насекомого, которое активно перемещается в пространстве, ищет брачных партнеров, размножается, откладывая яйца в трипсов [6].
С разработкой высокопроизводительных технологий секвенирования ДНК и РНК появилась реальная возможность более детально углубиться в проблемы эволюционных адаптаций, связанных с миниатюризацией. Группой американских исследователей была показана связь уменьшения размеров тела с серией репродуктивных адаптаций у игрунковых (приматы Нового Света). Сравнивая известные геномные последовательности приматов с геномом обыкновенной мармозетки (Callithrix jaccus, Coimbra-Filho, 1985) было показано, что у приматов Нового Света гены, связанные с ростом скелета (мультидомен ингибитора протеазы) и гены GDF9 и BMP15, влияющие на появление близнецов, несут несинонимичные замены. Выявленные мутации связаны с последовательной миниатюризацией после дивергенции обезьян Южной Америки от общего с человекообразными обезьянами и человеком предка [8].
К настоящему времени ресеквенирование геномов превратилось в рутинную процедуру, гораздо сложнее обстоит дело при биоинформатическом анализе геномных данных новых для науки видов, используя имеющиеся алгоритмы de novo сборки. Среди множества реконструированных геномов бактерий, грибов растений и животных представлены геномы насекомых, в том числе геномы медоносной пчелы (Apis mellifera Linnaeus, 1758), земляного
шмеля (Bombus terrestris Linnaeus, 1758), красного огненного муравья (Solenopsis invicta Buren, 1972), а также паразитических наездников Nasonia, для которых миниатюризация не свойственна [9][10].
Hydrodamalis gigas. Согласно палеонтологическим исследованиям, при переходе от позднего плейстоцена к раннему голоцену ареал стеллеровой коровы, впрочем как и остальных представителей отряда сирен, значительно фрагментировался [11], что, возможно, было вызвано ростом глобальных температур и сопутствующим повышением уровня Мирового океана [12].
Попытка реконструировать динамику численности H. gigas в районе Командорских островов в голоцене с использованием массового датирования костей была предпринята уже давно [13]. Однако в работе было использовано мало костей (порядка 25 образцов), чего явно недостаточно для полноценной реконструкции численности на протяжении значительного периода времени. Результаты датирования показали, что в основном в береговых отложениях находятся остатки животных возрастом до 2000 лет. Скорее всего это связано с особенностями их естественного захоронения в береговых отложениях Командорских островов.
Данные по геномике стеллеровой коровы до последнего времени были ограничены и демонстрировали филогенетические связи внутри отряда Sirena и его ближайших сородичей [14]. К настоящему времени опубликованы геномы двух современных видов, принадлежащих отряду Сирен -американского ламантина и дюгоня, которые могут быть использованы в качестве референсных последовательностей.
Научная новизна, теоретическая и практическая значимость работы
Megaphragma amalphitanum В данной работе впервые была собрана de novo и опубликована полная последовательность ядерного и митохондриального геномов паразитоидного наездника M. amalphitanum с использованием данных
секвенирования геномных библиотек. А также был собран de novo транскриптом M. amalphitanum. Полученные геномные и транскриптомные данные использовались для аннотации генома, которая выявила ряд белок-кодирующих и некодирующих последовательностей. Тем самым позволило выявить гены, генные кластеры и метаболические пути, вероятно, связанные с миниатюризацией M. amalphitanum.
Проведен поиск генов хеморецепторов в геноме M. amalphitanum с использованием генов-ортологов у близкородственных представителей отряда Hymenoptera и других насекомых. Был осуществлен поиск генов обонятельных (Odorant Receptors, OR), ионотропных (Ionotropic Receptors, IR) и вкусовых рецепторов (Gustatory Receptors, GR). С высокой точностью идентифицированы два гена IR25a, а также по одному гену IR93a, IR8a, IR68a, IR76b, IR21a, IR75 и IR64a-84a. Приблизительное общее число ионотропных рецепторов, чьи гены были выявлены в геноме, превысило 18. По такой же схеме, применяя белковый набор рецепторов обонятельных/ вкусовых, был идентифицирован консервативный ко-рецептор ORCO, а также пять рецепторов обонятельных/ вкусовых (OR1, OR2, atypical olfactory receptor, GR2 и GR3).
Кроме того, впервые была выполнена de novo сборка митохондриального генома миниатюрного жука-перокрылки (Scydosella musawasensis Hall, 1999), аннотация которого показалаотсутствие в нём гена trnI, что привело нас к предоложению о важности набора и порядка генов при анализе филогенетических взаимосвязей у беспозвоночных.
Далее был разработана программа mitoSpider, позволяющая проводить "граббинг" генов и геномов из базы NCBI (https://github.com/megaphragma/mitoSpider) для дальнейших
филогенетических построений. Полученные результаты показывают перспективность использования информации о порядке генов в качестве
дополнительного филогенетического маркера для отдельных видов, родов и семейств перепончатокрылых.
Hydrodamalis gigas. Впервые в мире была опубликована геномная сборка H. gigas из популяции Командорских островов, которая использовалась для оценки демографической истории этого животного в сравнении с другими вымершими и современными видами млекопитающих. Позднее международная группа исследователей частично улучшила аннотацию опубликованной сборки данного проекта, используя разработанную программу TOGA для аннотации ортологов, увеличив относительную длину кодирующих последовательностей с 28% до 70% (Kirilenko et al., 2022).
Демографический анализ командорской популяции стеллеровой коровы и для других вымерших видов показал, что у стеллеровой коровы было лишь одно генетическое бутылочное горлышко в течение последних сотен тысяч лет его эволюционной истории по сравнению с другими вымершими наземными травоядными млекопитающими. У шерстистого мамонта (Mammuthus primigenius Blumenbach, 1799) и ленской лошади (Equus cf. lenensis Russanov, 1968) за последние сотни тысяч лет было как минимум два крупных сокращения размера глобальной популяции.
В 2022 году международная группа исследователей проанализировала дополнительно 12 образцов стеллеровых коров с Командорских островов. Их анализ позволил добавить еще две геномных сборки [15] к ранее опубликованной нами. Авторы подтвердили ранее оцененное примерное время начала вымирания вида, а также выявили конвергентное направление эволюции у стеллеровой коровы с китообразными (но не с современными сиренами - дюгонь и ламантины), отводя важную роль нескольким генам в адаптации к холодной морской среде. Среди них была выявлена инактивация генов липоксигеназы, которая у людей вызывает ихтиоз — кожное заболевание, характеризующееся толстым гиперкератотическим эпидермисом, похожим на кожу стеллеровой коровы [15].
Впервые была восстановлена полная последовательность митохондриального генома этого вымершего животного. Митохондриальная ДНК исследованного образца H. gigas имела длину 16,872 пар оснований и содержала типичный для млекопитающих набор митохондриальных генов. Филогенетический анализ на основе полных митохондриальных геномов видов сирен позволил точно оценить степень их митогеномной диверсификации на протяжении миллионов лет эволюции. Качество сборки митохондриального генома было подтверждено в последующих работах [15].
В геноме стеллеровой коровы также были идентифицированы гены с очевидными признаками положительного отбора, и большинство из них связано с метаболическими, иммунными и гормональными сигнальными путями и, возможно, ассоциировано с анатомическими и физиологическими адаптациями H. gigas к плейстоцен-голоценовым климатическим условиям. Удивительно, но ген лептина (LEP), влияющий на энергетический гомеостаз и репродуктивную регуляцию, подвергся положительной селекции не только в геноме стеллеровой коровы, но и в геномах других морских млекопитающих. Это открытие свидетельствует о конвергентной эволюции не только современных морских [16], но и вымерших видов млекопитающих.
Секвенирование и анализ генома стеллеровой коровы пролили свет на эволюцию в отряде сирен и частично реабилитировали палеолитических и современных людей, которые обнаружили лишь небольшую часть некогда крупной популяции с относительно низким уровнем гетерозиготности. Средняя аутосомная гетерозиготность у H. gigas из последней популяции имеет промежуточное значение в сравнении с последней и генетически инбредной популяцией шерстистого мамонта с острова Врангеля (средний голоцен) - 1,00 и популяцией сибирского шерстистого мамонта, обнаруженного в Оймяконском районе Якутии (поздний плейстоцен) - 1,25. Это морское млекопитающее, скорее всего, стало жертвой значительных климатических изменений вовремя плейстоцен-голоценового перехода и
связанных с ними изменений окружающей среды. Повышение уровня Мирового Океана и температуры в позднем плейстоцене могли негативно сказаться на популяциях H. gigas, поскольку они населяли прибрежную зону. Резкое послеледниковое повышение уровня океана на рубеже плейстоцена и голоцена, по-видимому, окончательно раскололо популяцию стеллеровой морской коровы. Мы показали, что H. gigas, как и другие стенобиотические травоядные морские млекопитающие, возможно, были более чувствительны к изменению климата и сопутствующему повышению уровня моря, а также к потере кормовой базы и лежбищ.
Личный вклад автора
Автором была выполнена вся биоинформатическая обработка в данной работе: обработка данных секвенирования ДНК и РНК, реконструкуция de novo полных ядерных и митохондриальных геномов и их аннотация, сборка de novo транскриптомов и их аннотация, сравнительный анализ, филогенетический анализ, метагеномный анализ, анализ мобильных элементов, демографический анализ, разработка программных конвейеров и написание собственных вспомогательных программ для обработки данных. Также непосредственно автором диссертации при участии коллег проводилась подготовка научных публикаций. Отбор образцов, предобработка, выделение и секвенирование ДНК было выполнено сотрудниками НИЦ «Курчатовский институт» - Недолужко А.В., Расторгуевым С.М., Цыганковой С.В., Булыгиной Е.С. и Слободовой Н.М..
Степень достоверности и апробация результатов
Научные положения и выводы являются обоснованными. Полученные результаты являются достоверными и согласуются с современными литературными данными. Материалы диссертационной работы были
представлены на конференциях:
1. Шарко Ф.С. Изучение генетических аспектов миниатюризации на примере паразитической осы Megaphragma amalphitanum (Hymenoptera: Trichogrammidae). В кн.: NGS-2015, Москва 2015. С. 16.
2. Sokolov A.S., Nedoluzhko A.V., Sharko F.S., Boulygina E.S., Tsygankova S.V., Polilov A.A., Prokhortchouk E.B., Skryabin K.G. De-novo assembly of mitochondrial genome of the smallest insect Megaphragma amalphitanum (Hymenoptera: Trichogrammatidae) MAPEEG-2015. Vladivostok. 2015.
3. Sharko F.S., Nedoluzhko A.V., Rastorguev S.M., Polilov A.A., Skryabin K.G., Prokhortchouk E.B. The mitochondrial gene order and CYTB evolution in Hymenoptera and other insects. BGRS-2016, Новосибирск. С. 277.
4. Sokolov A.S., Nedoluzhko A.V., Sharko F.S., Boulygina E.S., Tsygankova S.V.,Mazur A.M., Polilov A.A., Prokhortchouk E.B., Skryabin K.G. De novo assembly of nuclear genome of the smallest insect Megaphragma amalphitanum (Hymenoptera: Trichogrammatidae) BGRS-2016, Новосибирск. С. 289.
Публикации по теме диссертации
По материалам работы опубликовано 11 печатных работ, из них 3 —
посвящены геномике стеллеровы коровы, а 8 геномным аспектам миниатюризации паразитоидного наездника M. amalphitanum:
1. Sharko, F.S., Rastorguev S.M., Tikhonov A.N., Nedoluzhko A.V.: Reply to: "Steller's sea cow uncertain history illustrates importance of ecological context when interpreting demographic histories from genomes" // Nature Communications. 2022. V.12. 10.1038/s41467-022-31382-5.
2. Sharko, F.S., Boulygina, E.S., Tsygankova, S.V., Slobodova N.V., Alekseev D.A., Krasivskaya A.A., Rastorguev S.M., Tikhonov A.N., Nedoluzhko A.V.:
Steller's sea cow genome suggests this species began going extinct before the arrival of Paleolithic humans // Nature Communications. 2021. V.12. 2215. doi:10.1038/s41467-021-22567-5.
3. Sharko F.S., Rastorguev S.M., Boulygina E.S., Tsygankova S.V., Ibragimova A.S., Tikhonov A.N., Nedoluzhko A.V.: Molecular phylogeny of the extinct Steller's sea cow and other Sirenia species based on their complete mitochondrial genomes // Genomics. 2019. V. 111(6). P. 1543-1546.
4. Sharko F.S., Nedoluzhko A.V., Le Brandon M., Tsygankova S.V., Boulygina E.S., Rastorguev S.M., Sokolov A.S., Rodriguez F., Mazur A.M., Polilov A.A., Benton R., Evgenev M.B., Arkhipova I.R., Prokhortchouk E.B., Skryabin K.G.. A partial genome assembly of the miniature parasitoid wasp, Megaphragma amalphitanum// PLoS ONE. 2019, 14(12),
5. Недолужко А.В., Кадников В.В., Белецкий А.В., Шарко Ф.С., Цыганкова С.В., Марданов А.В., Равин Н.В., Скрябин К.Г. Микроорганизмы, ассоциированные с микронасекомыми Megaphragma amalphitanum и Scydosella musawasensis // Микробиология. 2017, Т. 86 (4), С. 520-522
6. Чувакова Л.Н., Шарко Ф.С., Недолужко А.В., Полилов А.А., Прохорчук Е.Б., Скрябин К.Г., Евгеньев М.Б. Характеристика генов hsp70 паразитического наездника Megaphragma amalphitanum (Hymenoptera: Trichogrammatidae) // Молекулярная биология. 2017. №4. с. 615-621
7. Ф.С. Шарко, А.В. Недолужко, С.М. Расторгуев, С.В. Цыганкова, Е.С. Булыгина, А.А. Полилов, Е.Б. Прохорчук, К.Г. Скрябин. Порядок митохондриальных генов как дополнительный маркер в филогенетических исследованиях насекомых // Вавиловский журнал генетики и селекции. 2017. № 21(3). с. 368-373.
8. Прохорчук Е.Б., Недолужко А.В., Шарко Ф.С., Цыганкова С.В., Булыгина Е.С., Расторгуев С.М., Соколов А.С., Мазур А.М., Полилов А.А., Скрябин К.Г. Секвенирование генома и транскриптома миниатюрного перепончатокрылого Megaphragma amalphitanum
(Hymenoptera: Trichogrammatidae) // Вестник Московского университета. Серия 16: Биология, издательство Изд-во Моск. ун-та (М.). Т. 72. № 1. с.35-38
9. Nedoluzhko A.V., Sharko F.S., Tsygankova S.V., Boulygina E.S., Sokolov A.S., Rastorguev S.M., Kadnikov V.V., Mardanov A.V., Ravin N.V., Mazur A.M., Polilov A.A., Gruzdeva N.M., Prokhortchouk E.B., Skryabin K.G. Metagenomic analysis of microbial community of a parasitoid wasp Megaphragma amalphitanum // Genomics Data. V. 11. P. 87-88.
10.Nedoluzhko A.V., Sharko F.S., Boulygina E.S., Tsygankova S.V., Sokolov A.S., Mazur A.M., Polilov A.A., Prokhortchouk E.B., Skryabin K.G. The complete mitochondrial genome of the smallest known free-living insect Scydosella musawasensis // Mitochondrial DNA: Resources. 2016. V. 1 (1). P. 171-172.
11.Nedoluzhko A., Sharko F., Boulygina E., Tsygankova S., Sokolov A., Polilov A., Prokhortchouk E., Skryabin K. Mitochondrial genome of Megaphragma amalphitanum (Hymenoptera: Trichogrammatidae) // Mitochondrial DNA. 2016. V. 27 (6), pp. 4526-4527.
Структура и объем работы
Диссертация изложена на 203 страницах машинописного текста, содержит 25 таблиц и 45 рисунков. Работа разделена на две части, каждая из которых посвящена своему объекту исследования (первая - темегеномным аспектам миниатюризации паразитоидного наездника M. amalphitanum; вторая -геномике вымершей стеллеровой коровы H. gigas), включающие свое описания материалов и методов, результатов и обсуждения. А также из общей части, состоящей из введения, обзора литературы и списка цитируемой литературы, содержащего 301 ссылку.
ОБЗОР ЛИТЕРАТУРЫ
1.1. Биологическое описание объектов исследования
1.1.1. Стеллерова корова, ИуйгойатаШ ^аз
Стеллерова корова или капустница (Hydrodamalis gigas) - вымершее животное из отряда сирен ^гета) полностью истреблённое человеком в середине 18 века. К моменту открытия и описания этого вида участниками Второй Камчатской экспедиции Витуса Беринга (1740—1742), стеллерова корова обитала лишь у побережья Командорских островов (о. Медный и о. Беринга). Расцвет этого вида, населявшего прибрежные районы северной части Тихого океана (включая Берингово море) пришелся на конец позднеплейстоценового оледенения, когда его ареал охватил всю северную часть тихоокеанских побережий, от Японии через Алеутские острова вплоть до Калифорнии [17] _(Рисунок 1).
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Поиск транскрипционных факторов, регулирующих трансдифференцировку клеток при регенерации кишки у голотурии Eupentacta fraudatrix2022 год, кандидат наук Бойко Алексей Вячеславович
Определение и анализ нуклеотидных последовательностей митохондриального и хлоропластного геномов диатомовой водоросли Synedra acus2012 год, кандидат биологических наук Галачьянц, Юрий Павлович
Эволюционно-генетический сигнал отрицательного отбора и рекомбинации в полногеномных данных2022 год, кандидат наук Вахрушева Ольга Александровна
Дивергентные митогеномы беспозвоночных животных2022 год, кандидат наук Николаева Ольга Владимировна
Геномная изменчивость у береговых чукчей, эскимосов и командорских алеутов2016 год, кандидат наук Дрёмов, Станислав Вячеславович
Список литературы диссертационного исследования кандидат наук Шарко Федор Сергеевич, 2023 год
СПИСОК ЛИТЕРАТУРЫ
1 Polilov, A.A. (2017) First record of Megaphragma (Hymenoptera, Trichogrammatidae) in Columbia, and third animal species known to have anucleate neurons. JHR 60, 181— 185
2 Hanken, J. and Wake, D.B. (1993) Miniaturization of body size: organismal consequences and evolutionary significance. Annu. Rev. Ecol. Syst. 24, 501-519
3 Polilov, A.A. and Beutel, R.G. (2010) Developmental stages of the hooded beetle Sericoderus lateralis (Coleoptera: Corylophidae) with comments on the phylogenetic position and effects of miniaturization. Arthropod Struct. Dev. 39, 52-69
4 Grebennikov, V.V. and Beutel, R.G. (2002) Morphology of the minute larva of Ptinella tenella, with special reference to effects of miniaturisation and the systematic position of Ptiliidae (Coleoptera: Staphylinoidea). Arthropod Struct. Dev. 31, 157-172
5 Liu, S. et al. (2012) Chromosome evolution and genome miniaturization in minifish.
PLoS ONE 7, e37305
6 Polilov, A.A. (2012) The smallest insects evolve anucleate neurons. Arthropod Struct. Dev. 41, 29-34
7 Nijhout, H.F. and Grunert, L.W. (2002) Bombyxin is a growth factor for wing imaginal disks in Lepidoptera. Proc Natl Acad Sci USA 99, 15446-15450
8 Harris, R.A. et al. (2014) Evolutionary genetics and implications of small size and twinning in callitrichine primates. Proc Natl Acad Sci USA 111, 1467-1472
9 Stolle, E. et al. (2011) A second generation genetic map of the bumblebee Bombus terrestris (Linnaeus, 1758) reveals slow genome and chromosome evolution in the Apidae. BMC Genomics 12, 48
10 Wurm, Y. et al. (2011) The genome of the fire ant Solenopsis invicta. Proc Natl Acad Sci USA 108, 5679-5684
11 Domning, D.P. (2018) Sirenian Evolution. In Encyclopedia of marine mammals pp. 856859, Elsevier
12 Pavlova, E.Y. and Pitulko, V.V. (2020) Late Pleistocene and Early Holocene climate changes and human habitation in the arctic Western Beringia based on revision of palaeobotanical data. Quaternary International 549, 5-25
13 Savinetsky, A.B. et al. (2004) Dynamics of sea mammal and bird populations of the Bering Sea region over the last several millennia. Palaeogeography, Palaeoclimatology, Palaeoecology 209, 335-352
14 Springer, M.S. et al. (2015) Interordinal gene capture, the phylogenetic position of Steller's sea cow based on molecular and morphological data, and the macroevolutionary history of Sirenia. Mol. Phylogenet. Evol. 91, 178-193
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Le Duc, D. et al. (2022) Genomic basis for skin phenotype and cold adaptation in the extinct Steller's sea cow. Sci. Adv. 8, eabl6496
Foote, A.D. et al. (2015) Convergent evolution of the genomes of marine mammals. Nat. Genet. 47, 272-275
Mattioli, S. and Domning, D.P. (2006) An Annotated List of Extant Skeletal Material of Steller's Sea Cow (Hydrodamalisgigas) (Sirenia: Dugongidae) from the Commander Islands. Aquat. Mamm. 32, 273-288
Sharko, F.S. et al. (2021) Steller's sea cow genome suggests this species began going extinct before the arrival of Paleolithic humans. Nat. Commun. 12, 2215
Anderson, P.K. and Domning, D.P. (2009) Steller's Sea Cow. In Encyclopedia of marine mammals pp. 1103-1106, Elsevier
Ozawa, T. et al. (1997) Phylogenetic position of mammoth and Steller's sea cow within Tethytheria demonstrated by mitochondrial DNA sequences. J. Mol. Evol. 44, 406-413
Polilov, A.A. (2015) Small is beautiful: features of the smallest insects and limits to miniaturization. Annu. Rev. Entomol. 60, 103-121
Branstetter, M.G. et al. (2017) Phylogenomic Insights into the Evolution of Stinging Wasps and the Origins of Ants and Bees. Curr. Biol. 27, 1019-1025
Nedoluzhko, A.V. et al. (2016) Mitochondrial genome of Megaphragma amalphitanum (Hymenoptera: Trichogrammatidae). Mitochondrial DNA A DNA Mapp. Seq. Anal. 27, 4526-4527
Owen, A.K. et al. (2007) A molecular phylogeny of the Trichogrammatidae (Hymenoptera: Chalcidoidea), with an evaluation of the utility of their male genitalia for higher level classification. Syst. Entomol. 32, 227-251
Heraty, J.M. et al. (2013) A phylogenetic analysis of the megadiverse Chalcidoidea (Hymenoptera). Cladistics 29, 466-542
Peters, R.S. et al. (2018) Transcriptome sequence-based phylogeny of chalcidoid wasps (Hymenoptera: Chalcidoidea) reveals a history of rapid radiations, convergence, and evolutionary success. Mol. Phylogenet. Evol. 120, 286-296
Schulz, H.N. et al. (1999) Dense populations of a giant sulfur bacterium in Namibian shelf sediments. Science 284, 493-495
Standage, D.S. et al. (2016) Genome, transcriptome and methylome sequencing of a primitively eusocial wasp reveal a greatly reduced DNA methylation system in a social insect. Mol. Ecol. 25, 1769-1784
Howorka, S. et al. (2001) Sequence-specific detection of individual DNA strands using engineered nanopores. Nat. Biotechnol. 19, 636-639
Stoddart, D. et al. (2009) Single-nucleotide discrimination in immobilized DNA oligonucleotides with a biological nanopore. Proc Natl Acad Sci USA 106, 7702-7707
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
Orlando, L. et al. (2011) True single-molecule DNA sequencing of a pleistocene horse bone. Genome Res. 21, 1705-1719
Miller, W. et al. (2008) Sequencing the nuclear genome of the extinct woolly mammoth. Nature 456, 387-390
Keller, A. et al. (2012) New insights into the Tyrolean Iceman's origin and phenotype as inferred by whole-genome sequencing. Nat. Commun. 3, 698
Martin, M.D. et al. (2013) Reconstructing genome evolution in historic samples of the Irish potato famine pathogen. Nat. Commun. 4, 2172
Yoshida, K. et al. (2013) The rise and fall of the Phytophthora infestans lineage that triggered the Irish potato famine. eLife 2, e00731
Rohland, N. et al. (2018) Extraction of highly degraded DNA from ancient bones, teeth and sediments for high-throughput sequencing. Nat. Protoc. 13, 2447-2461
Lindahl, T. (1993) Instability and decay of the primary structure of DNA. Nature 362, 709-715
Kavli, B. et al. (2007) Uracil in DNA--general mutagen, but normal intermediate in acquired immunity. DNA Repair (Amst) 6, 505-516
Sawyer, S. et al. (2012) Temporal patterns of nucleotide misincorporations and DNA fragmentation in ancient DNA. PLoS ONE 7, e34131
Jonsson, H. et al. (2013) mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. Bioinformatics 29, 1682-1684
Fu, Q. et al. (2014) Genome sequence of a 45,000-year-old modern human from western Siberia. Nature 514, 445-449
Briggs, A.W. et al. (2010) Removal of deaminated cytosines and detection of in vivo methylation in ancient DNA. Nucleic Acids Res. 38, e87
Dabernat, H. et al. (2014) Tuberculosis epidemiology and selection in an autochthonous Siberian population from the 16th-19th century. PLoS ONE 9, e89877
Mutolo, M.J. et al. (2012) Osteological and molecular identification of Brucellosis in ancient Butrint, Albania. Am. J. Phys. Anthropol. 147, 254-263
Nguyen-Hieu, T. et al. (2010) Evidence of a louse-borne outbreak involving typhus in Douai, 1710-1712 during the war of Spanish succession. PLoS ONE 5, e15405
Zavala, E.I. et al. (2021) Pleistocene sediment DNA reveals hominin and faunal turnovers at Denisova Cave. Nature 595, 399-403
Andrades Valtuena, A. et al. (2022) Stone Age Yersinia pestis genomes shed light on the early evolution, diversity, and ecology of plague. Proc Natl Acad Sci USA 119, e2116722119
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
Bos, K.I. et al. (2011) A draft genome of Yersinia pestis from victims of the Black Death. Nature 478, 506-510
Spyrou, M.A. et al. (2022) The source of the Black Death in fourteenth-century central Eurasia. Nature 606, 718-724
Sokolov, A.S. et al. (2016) Six complete mitochondrial genomes from Early Bronze Age humans in the North Caucasus. J. Archaeol. Sci. 73, 138-144
Bendrey, R. et al. (2008) Suspected bacterial disease in two archaeological horse skeletons from southern England: palaeopathological and biomolecular studies. J. Archaeol. Sci. 35, 1581-1590
Capasso, L. (1999) Brucellosis at herculaneum (79AD). Int. J. Osteoarchaeol. 9, 277288
Kousoulis, A.A. et al. (2012) The fatal disease of Emperor Galerius. J. Am. Coll. Surg. 215,890-893
Papagrigorakis, M.J. et al. (2006) DNA examination of ancient dental pulp incriminates typhoid fever as a probable cause of the Plague of Athens. Int. J. Infect. Dis. 10, 206-214
Shapiro, B. et al. (2006) No proof that typhoid caused the Plague of Athens (a reply to Papagrigorakis et al.). Int. J. Infect. Dis. 10, 334-335
Mutolo, M.J. et al. (2012) Tumor suppression by collagen XV is independent of the restin domain. Matrix Biol. 31, 285-289
Rothschild, B. and Haeusler, M. (2021) Possible vertebral brucellosis infection in a Neanderthal. Sci. Rep. 11, 19846
Mann, A.E. et al. (2018) Differential preservation of endogenous human and microbial DNA in dental calculus and dentin. Sci. Rep. 8, 9822
Jensen, T.Z.T. et al. (2019) A 5700 year-old human genome and oral microbiome from chewed birch pitch. Nat. Commun. 10, 5520
Rampelli, S. et al. (2021) Components of a Neanderthal gut microbiome recovered from fecal sediments from El Salt. Commun. Biol. 4, 169
Caporaso, J.G. et al. (2010) QIIME allows analysis of high-throughput community sequencing data. Nat. Methods 7, 335-336
Segata, N. et al. (2012) Metagenomic microbial community profiling using unique clade-specific marker genes. Nat. Methods 9, 811-814
Huson, D.H. et al. (2016) MEGAN Community Edition - Interactive Exploration and Analysis of Large-Scale Microbiome Sequencing Data. PLoS Comput. Biol. 12, e1004957
Nayfach, S. et al. (2016) An integrated metagenomics pipeline for strain profiling reveals novel patterns of bacterial transmission and biogeography. Genome Res. 26, 1612-1625
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
Velsko, I.M. et al. (2018) Selection of appropriate metagenome taxonomic classifiers for ancient microbiome research. mSystems 3,
Ounit, R. and Lonardi, S. (2016) Higher classification sensitivity of short metagenomic reads with CLARK-S. Bioinformatics 32, 3823-3825
Hubler, R. et al. (2019) HOPS: automated detection and authentication of pathogen DNA in archaeological remains. Genome Biol. 20, 280
Miller, J.R. et al. (2010) Assembly algorithms for next-generation sequencing data. Genomics 95, 315-327
Compeau, P.E.C. et al. (2011) How to apply de Bruijn graphs to genome assembly. Nat. Biotechnol. 29, 987-991
Nagarajan, N. and Pop, M. (2013) Sequence assembly demystified. Nat. Rev. Genet. 14, 157-167
Koito, A. and Ikeda, T. (2013) Intrinsic immunity against retrotransposons by APOBEC cytidine deaminases. Front. Microbiol. 4, 28
Cordaux, R. and Batzer, M.A. (2009) The impact of retrotransposons on human genome evolution. Nat. Rev. Genet. 10, 691-703
1000 Genomes Project Consortium et al. (2012) An integrated map of genetic variation from 1,092 human genomes. Nature 491, 56-65
Pendleton, M. et al. (2015) Assembly and diploid architecture of an individual human genome via single-molecule technologies. Nat. Methods 12, 780-786
Chaisson, M.J.P. et al. (2015) Genetic variation and the de novo assembly of human genomes. Nat. Rev. Genet. 16, 627-640
Motahari, A.S. et al. (2013) Information theory of DNA shotgun sequencing. IEEE Trans. Inform. Theory 59, 6273-6289
Simpson, J.T. and Pop, M. (2015) The theory and practice of genome sequence assembly. Annu. Rev. Genomics Hum. Genet. 16, 153-172
He, Y. et al. (2013) De novo assembly methods for next generation sequencing data. Tsinghua Sci. Technol. 18, 500-514
El-Metwally, S. et al. (2013) Next-generation sequence assembly: four stages of data processing and computational challenges. PLoS Comput. Biol. 9, e1003345
Paszkiewicz, K. and Studholme, D.J. (2010) De novo assembly of short sequence reads. Brief. Bioinformatics 11, 457-472
Kosugi, S. et al. (2015) GMcloser: closing gaps in assemblies accurately with a likelihood-based selection of contig or long-read alignments. Bioinformatics 31, 37333741
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
Paulino, D. et al. (2015) Sealer: a scalable gap-closing application for finishing draft genomes. BMC Bioinformatics 16, 230
Luo, R. et al. (2012) SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Gigascience 1, 18
Boetzer, M. and Pirovano, W. (2012) Toward almost closed genomes with GapFiller. Genome Biol. 13, R56
Tsai, I.J. et al. (2010) Improving draft assemblies by iterative mapping and assembly of short reads to eliminate gaps. Genome Biol. 11, R41
Sohn, J.-I. and Nam, J.-W. (2018) The present and future of de novo whole-genome assembly. Brief. Bioinformatics 19, 23-40
Simpson, J.T. and Durbin, R. (2012) Efficient de novo assembly of large genomes using compressed data structures. Genome Res. 22, 549-556
Simpson, J.T. et al. (2009) ABySS: a parallel assembler for short read sequence data. Genome Res. 19, 1117-1123
Chapman, J.A. et al. (2011) Meraculous: de novo genome assembly with short paired-end reads. PLoS ONE 6, e23501
Zerbino, D.R. and Birney, E. (2008) Velvet: algorithms for de novo short read assembly using de Bruijn graphs. Genome Res. 18, 821-829
Pevzner, P.A. et al. (2001) An Eulerian path approach to DNA fragment assembly. Proc Natl Acad Sci USA 98, 9748-9753
Thomason, A. (1989) A simple linear expected time algorithm for finding a hamilton path. Discrete Math. 75, 373-379
Li, R. et al. (2010) De novo assembly of human genomes with massively parallel short read sequencing. Genome Res. 20, 265-272
Cole, R. et al. (2001) Edge-Coloring Bipartite Multigraphs in O ( E log D ) Time. Combinatorica 21, 5-12
Bankevich, A. et al. (2012) SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, 455-477
Gnerre, S. et al. (2011) High-quality draft assemblies of mammalian genomes from massively parallel sequence data. Proc Natl Acad Sci USA 108, 1513-1518
Zimin, A.V. et al. (2013) The MaSuRCA genome assembler. Bioinformatics 29, 26692677
Mardis, E.R. (2008) Next-generation DNA sequencing methods. Annu. Rev. Genomics Hum. Genet. 9, 387-402
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
Xie, C. and Tammi, M.T. (2009) CNV-seq, a new method to detect copy number variation using high-throughput sequencing. BMC Bioinformatics 10, 80
Sims, D. et al. (2014) Sequencing depth and coverage: key considerations in genomic analyses. Nat. Rev. Genet. 15, 121-132
Ross, M.G. et al. (2013) Characterizing and measuring bias in sequence data. Genome Biol. 14, R51
Ribeiro, F.J. et al. (2012) Finished bacterial genomes from shotgun sequence data. Genome Res. 22, 2270-2277
Ye, C. et al. (2012) Exploiting sparseness in de novo genome assembly. BMC Bioinformatics 13 Suppl 6, S1
Melsted, P. and Pritchard, J.K. (2011) Efficient counting of k-mers in DNA sequences using a bloom filter. BMC Bioinformatics 12, 333
Pell, J. et al. (2012) Scaling metagenome sequence assembly with probabilistic de Bruijn graphs. Proc Natl Acad Sci USA 109, 13272-13277
Myers, E.W. et al. (2000) A whole-genome assembly of Drosophila. Science 287, 21962204
Zimin, A. et al. (2014) Sequencing and assembly of the 22-gb loblolly pine genome. Genetics 196, 875-890
Medvedev, P. et al. (2011) Paired de Bruijn Graphs: A Novel Approach for Incorporating Mate Pair Information into Genome Assemblers. In Research in computational molecular biology 6577 (Bafna, V. and Sahinalp, S. C., eds), pp. 238-251, Springer Berlin Heidelberg
Ashton, P.M. et al. (2015) MinION nanopore sequencing identifies the position and structure of a bacterial antibiotic resistance island. Nat. Biotechnol. 33, 296-300
Goodwin, S. et al. (2015) Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome. Genome Res. 25, 1750-1756
Oikonomopoulos, S. et al. (2016) Benchmarking of the Oxford Nanopore MinION sequencing for quantitative and qualitative assessment of cDNA populations. Sci. Rep. 6, 31602
Koren, S. and Phillippy, A.M. (2015) One chromosome, one contig: complete microbial genomes from long-read sequencing and assembly. Curr. Opin. Microbiol. 23, 110-120
Madoui, M.-A. et al. (2015) Genome assembly using Nanopore-guided long and error-free DNA reads. BMC Genomics 16, 327
Laver, T. et al. (2015) Assessing the performance of the Oxford Nanopore Technologies MinION. Biomolecular Detection and Quantification 3, 1-8
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
Schaeffer, E.M. (2012) Re: origins of the E. coli strain causing an outbreak of hemolytic-uremic syndrome in Germany. J. Urol. 187, 514-515
Treangen, T.J. et al. (2011) Next generation sequence assembly with AMOS. Curr. Protoc. Bioinformatics Chapter 11, Unit 11.8
Chaisson, M.J. and Tesler, G. (2012) Mapping single molecule sequencing reads using basic local alignment with successive refinement (BLASR): application and theory. BMC Bioinformatics 13, 238
Berlin, K. et al. (2015) Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. Nat. Biotechnol. 33, 623-630
Myers, G. (2014) Efficient Local Alignment Discovery amongst Noisy Long Reads. In Algorithms in Bioinformatics 8701 (Brown, D. and Morgenstern, B., eds), pp. 52-67, Springer Berlin Heidelberg
Koren, S. et al. (2012) Hybrid error correction and de novo assembly of single-molecule sequencing reads. Nat. Biotechnol. 30, 693-700
Deshpande, V. et al. (2013) Cerulean: A hybrid assembly using high throughput short and long reads. In Algorithms in Bioinformatics 8126 (Darling, A. and Stoye, J., eds), pp. 349-363, Springer Berlin Heidelberg
Antipov, D. et al. (2016) hybridSPAdes: an algorithm for hybrid assembly of short and long reads. Bioinformatics 32, 1009-1015
Ye, C. et al. (2016) DBG2OLC: efficient assembly of large genomes using long erroneous reads of the third generation sequencing technologies. Sci. Rep. 6, 31900
Chin, C.-S. et al. (2013) Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data. Nat. Methods 10, 563-569
Ye, C. and Ma, Z.S. (2016) Sparc: a sparsity-based consensus algorithm for long erroneous sequencing reads. PeerJ 4, e2016
van Dijk, E.L. et al. (2014) Ten years of next-generation sequencing technology. Trends Genet. 30, 418-426
Au, K.F. et al. (2012) Improving PacBio long read accuracy by short read alignment. PLoS ONE 7, e46679
Myers, E.W. (2005) The fragment assembly string graph. Bioinformatics 21 Suppl 2, ii79-85
Yandell, M. and Ence, D. (2012) A beginner's guide to eukaryotic genome annotation. Nat. Rev. Genet. 13, 329-342
Haridas, S. et al. (2018) Fungal Genome Annotation. Methods Mol. Biol. 1775, 171-184
Flynn, J.M. et al. (2020) RepeatModeler2 for automated genomic discovery of transposable element families. Proc Natl Acad Sci USA 117, 9451-9457
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
Tempel, S. (2012) Using and understanding RepeatMasker. MethodsMol. Biol. 859, 2951
Frith, M.C. (2011) A new repeat-masking method enables specific detection of homologous sequences. Nucleic Acids Res. 39, e23
Hubley, R. et al. (2016) The Dfam database of repetitive DNA families. Nucleic Acids Res. 44, D81-9
Chan, P.P. and Lowe, T.M. (2019) tRNAscan-SE: Searching for tRNA Genes in Genomic Sequences. Methods Mol. Biol. 1962, 1-14
Laslett, D. and Canback, B. (2004) ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences. Nucleic Acids Res. 32, 11-16
Laslett, D. and Canback, B. (2008) ARWEN: a program to detect tRNA genes in metazoan mitochondrial nucleotide sequences. Bioinformatics 24, 172-175
An, J. et al. (2013) miRDeep*: an integrated application tool for miRNA identification from RNA sequencing data. Nucleic Acids Res. 41, 727-737
Hackenberg, M. et al. (2011) miRanalyzer: an update on the detection and analysis of microRNAs in high-throughput sequencing experiments. Nucleic Acids Res. 39, W132-8
Gautheret, D. and Lambert, A. (2001) Direct RNA motif definition and identification from multiple sequence alignments using secondary structure profiles. J. Mol. Biol. 313, 1003-1011
Wang, X. et al. (2005) MicroRNA identification based on sequence and structure alignment. Bioinformatics 21, 3610-3614
Eddy, S R. (2011) Accelerated profile HMM searches. PLoS Comput. Biol. 7, e1002195
Kalvari, I. et al. (2018) Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families. Nucleic Acids Res. 46, D335-D342
Lomsadze, A. et al. (2005) Gene identification in novel eukaryotic genomes by self-training algorithm. Nucleic Acids Res. 33, 6494-6506
Zhang, S. et al. (2008) The prediction of rice gene by fgenesh. Agricultural Sciences in China 7, 387-394
Keller, O. et al. (2011) A novel hybrid gene prediction method employing protein multiple sequence alignments. Bioinformatics 27, 757-763
Korf, I. (2004) Gene finding in novel genomes. BMC Bioinformatics 5, 59
Majoros, W.H. et al. (2004) TigrScan and GlimmerHMM: two open source ab initio eukaryotic gene-finders. Bioinformatics 20, 2878-2879
Birney, E. et al. (2004) GeneWise and Genomewise. Genome Res. 14, 988-995
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
Gotoh, O. (2008) Direct mapping and alignment of protein sequences onto genomic sequence. Bioinformatics 24, 2438-2444
Slater, G.S.C. and Birney, E. (2005) Automated generation of heuristics for biological sequence comparison. BMC Bioinformatics 6, 31
Bruna, T. et al. (2020) GeneMark-EP+: eukaryotic gene prediction with self-training in the space of genes and proteins. NAR Genom. Bioinform. 2, lqaa026
Grabherr, M.G. et al. (2011) Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nat. Biotechnol. 29, 644-652
Bushmanova, E. et al. (2019) rnaSPAdes: a de novo transcriptome assembler and its application to RNA-Seq data. Gigascience 8,
Chang, Z. et al. (2015) Bridger: a new framework for de novo transcriptome assembly using RNA-seq data. Genome Biol. 16, 30
Xie, Y. et al. (2014) SOAPdenovo-Trans: de novo transcriptome assembly with short RNA-Seq reads. Bioinformatics 30, 1660-1666
Trapnell, C. et al. (2012) Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc. 7, 562-578
Dobin, A. et al. (2013) STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21
Haas, B.J. et al. (2003) Improving the Arabidopsis genome annotation using maximal transcript alignment assemblies. Nucleic Acids Res. 31, 5654-5666
Lomsadze, A. et al. (2014) Integration of mapped RNA-Seq reads into automatic training of eukaryotic gene finding algorithm. Nucleic Acids Res. 42, e119
El-Gebali, S. et al. (2019) The Pfam protein families database in 2019. Nucleic Acids Res. 47, D427-D432
Armenteros, J.J.A. et al. (2019) SignalP 5.0 improves signal peptide predictions using deep neural networks. Nat. Biotechnol. 37, 420-423
Quevillon, E. et al. (2005) InterProScan: protein domains identifier. Nucleic Acids Res. 33, W116-20
Camacho, C. et al. (2009) BLAST+: architecture and applications. BMC Bioinformatics 10, 421
Hancock, J.M. (2004) BLAT (BLAST-like Alignment Tool). In Dictionary of bioinformatics and computational biology (Hancock, J. M. and Zvelebil, M. J., eds), John Wiley & Sons, Inc.
Buchfink, B. et al. (2015) Fast and sensitive protein alignment using DIAMOND. Nat. Methods 12, 59-60
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
Rawlings, N.D. and Bateman, A. (2021) How to use the MEROPS database and website to help understand peptidase specificity. Protein Sci. 30, 83-92
Koonin, E.V. et al. (2004) A comprehensive evolutionary classification of proteins encoded in complete eukaryotic genomes. Genome Biol. 5, R7
Ashburner, M. et al. (2000) Gene Ontology: tool for the unification of biology. Nat. Genet. 25, 25-29
Kanehisa, M. et al. (2017) KEGG: new perspectives on genomes, pathways, diseases and drugs. Nucleic Acids Res. 45, D353-D361
Finn, R.D. et al. (2017) InterPro in 2017-beyond protein family and domain annotations.
Nucleic Acids Res. 45, D190-D199
Kanehisa, M. and Sato, Y. (2020) KEGG Mapper for inferring cellular functions from protein sequences. Protein Sci. 29, 28-35
Emms, D.M. and Kelly, S. (2015) OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. Genome Biol. 16, 157
Li, L. et al. (2003) OrthoMCL: identification of ortholog groups for eukaryotic genomes. Genome Res. 13, 2178-2189
Testa, A.C. et al. (2015) CodingQuarry: highly accurate hidden Markov model gene prediction in fungal genomes using RNA-seq transcripts. BMC Genomics 16, 170
Cantarel, B.L. et al. (2008) MAKER: an easy-to-use annotation pipeline designed for emerging model organism genomes. Genome Res. 18, 188-196
Ter-Hovhannisyan, V. et al. (2008) Gene prediction in novel fungal genomes using an ab initio algorithm with unsupervised training. Genome Res. 18, 1979-1990
Liu, J. et al. (2014) OMIGA: Optimized Maker-Based Insect Genome Annotation. Mol. Genet. Genomics 289, 567-573
Langmead, B. and Salzberg, S.L. (2012) Fast gapped-read alignment with Bowtie 2. Nat. Methods 9, 357-359
Hoff, K.J. et al. (2016) BRAKER1: Unsupervised RNA-Seq-Based Genome Annotation with GeneMark-ET and AUGUSTUS. Bioinformatics 32, 767-769
Bruna, T. et al. (2021) BRAKER2: automatic eukaryotic genome annotation with GeneMark-EP+ and AUGUSTUS supported by a protein database. NAR Genom. Bioinform. 3, lqaa108
Palmer, J.M. and Stajich, J. (2020) Funannotate v1.8.1: Eukaryotic genome annotation. Zenodo DOI: 10.5281/zenodo.4054262
Dohmen, E. et al. (2016) DOGMA: domain-based transcriptome and proteome quality assessment. Bioinformatics 32, 2577-2581
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
Simao, F.A. et al. (2015) BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics 31, 3210-3212
Emerson, B.C. et al. (2001) Revealing the demographic histories of species using DNA sequences. Trends Ecol. Evol. 16, 707-716
Hey, J. and Machado, C.A. (2003) The study of structured populations—new hope for a difficult and divided science. Nat. Rev. Genet. 4, 535-543
Ho, S.Y.W. and Shapiro, B. (2011) Skyline-plot methods for estimating demographic history from nucleotide sequences. Mol. Ecol. Resour. 11, 423-434
Csillery, K. et al. (2010) Approximate Bayesian Computation (ABC) in practice. Trends Ecol. Evol. 25, 410-418
Pybus, O.G. et al. (2000) An integrated framework for the inference of viral population history from reconstructed genealogies. Genetics 155, 1429-1437
Drummond, A.J. et al. (2005) Bayesian coalescent inference of past population dynamics from molecular sequences. Mol. Biol. Evol. 22, 1185-1192
Nikolic, N. and Chevalet, C. (2014) Detecting past changes of effective population size. Evol. Appl. 7, 663-681
Heled, J. and Drummond, A.J. (2008) Bayesian inference of population size history from multiple loci. BMC Evol. Biol. 8, 289
Edwards, S.V. and Beerli, P. (2000) Perspective: gene divergence, population divergence, and the variance in coalescence time in phylogeographic studies. Evolution 54, 18391854
Ellegren, H. (2014) Genome sequencing and population genomics in non-model organisms. Trends Ecol. Evol. 29, 51-63
Li, H. and Durbin, R. (2011) Inference of human population history from individual whole-genome sequences. Nature 475, 493-496
Groenen, M.A.M. et al. (2012) Analyses of pig genomes provide insight into porcine demography and evolution. Nature 491, 393-398
Cho, Y.S. et al. (2013) The tiger genome and comparative analysis with lion and snow leopard genomes. Nat. Commun. 4, 2433
Zhan, X. et al. (2013) Peregrine and saker falcon genome sequences provide insights into evolution of a predatory lifestyle. Nat. Genet. 45, 563-566
Zhao, S. et al. (2013) Whole-genome sequencing of giant pandas provides insights into demographic history and local adaptation. Nat. Genet. 45, 67-71
Li, S. et al. (2014) Genomic signatures of near-extinction and rebirth of the crested ibis and other endangered bird species. Genome Biol. 15, 557
201
202
203
204
205
206
207
208
209
210
211
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.