Изучение адаптации и преадаптации муравьев Lasius niger к урбанизированной среде методами молекулярной экологии тема диссертации и автореферата по ВАК РФ 03.02.05, кандидат наук Коноров Евгений Андреевич

  • Коноров Евгений Андреевич
  • кандидат науккандидат наук
  • 2018, ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова»
  • Специальность ВАК РФ03.02.05
  • Количество страниц 189
Коноров Евгений Андреевич. Изучение адаптации и преадаптации муравьев Lasius niger к урбанизированной среде методами молекулярной экологии: дис. кандидат наук: 03.02.05 - Энтомология. ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова». 2018. 189 с.

Оглавление диссертации кандидат наук Коноров Евгений Андреевич

ВВЕДЕНИЕ

ОБЗОР ЛИТЕРАТУРЫ

1. Антропогенная эволюция насекомых

1.1. Факторы, влияющие на жизнь насекомых в городских условиях__

1.2. Генетические особенности адаптации насекомых в городе

1.3. Особенности биологии и экологии Lasius niger

2. Молекулярная экология и её методы

3. Сравнительная геномика муравьёв

3.1. Методы сравнительной геномики

3.2. Муравьи с известными геномами: особенности биологии и результаты полногеномных исследований

3.2.1. Harpegnathos saltator

3.2.2. Linepithema humile

3.2.3. Camponotus floridanus_

3.2.4. Acromyrmex echinatior _

3.2.5. Atta cephalotes

3.2.6. Pogonomyrmex barbatus

3.2.7. Solenopsis invicta_

3.2.8. Monomorium pharaonic_

3.2.9. Vollenhovia emeryi

3.2.10. Wasmannia auropunctata_

3.2.11. Cardiocondyla obscurior

3.2.12. Cerapachys biroi

4. Популяционная геномика и её методы

5. Генные семейства и генетические системы организма, рассматривавшиеся в ходе сравнения геномов муравьев и в исследованиях адаптации насекомых к урбанизированным биотопам

5.1. Системы детоксикации

5.1.1. Цитохромы P450

5.1.2. Глутатион-8-трансферазы

5.2 Системы коммуникации

5.2.1. Обонятельные рецепторы

5.2.2. Одорант-связывающие белки

5.2.3. Десатуразы жирных кислот

5.2.4. Синтазы жирных кислот

5.3. Нейропептиды

5.4. Гены, вовлечённые в иммунный ответ_

6. Метагеномика насекомых

6.1. Методы метагеномных исследований

6.1. Метагеномные исследования муравьёв

6.2. Исследования микробиоты Lasius_

7. Детекция отбора

7.1. Детекция отбора между популяциями одного и того же вида

7.2. Детекция отбора между разошедшимися видами

8. Молекулярное моделирование и его приложения в энтомологических исследованиях

8.1. Молекулярное моделирование, молекулярный докинг и виртуальный скрининг_

8.2. Приложения молекулярного докинга в энтомологии

МАТЕРИАЛЫ И МЕТОДЫ

1. Сбор материала

2. Сборка генома Ьазшз niger_

3. Источники кодирующих и предсказанных белковых последовательностей остальных видов, включенных в анализ

4. Предсказание генов и функциональная аннотация

5. Фильтрация материала перед выравниванием

6. Выравнивание последовательностей и построение филогенетических деревьев

7. Детекция отбора

8. Моделирование белков по предсказанным аминокислотным последовательностям

9. Молекулярный докинг и виртуальный скрининг

10. Полногеномное сравнение популяций

11. Метагеномный анализ

РЕЗУЛЬТАТЫ

1. Параметры сборки генома

2. Представленность генных онтологий

3. Повторяющиеся элементы генома и белки ретровирусов и ретротранспозонов

4. Цитохромы Г450,

4.1. Семейство CYP9

4.2. Семейство CYP9 Lasiusflavus_

4.3. Семейство CYP4

4.4. Cемейство CYP6

5. Результаты молекулярного докинга и виртуального скрининга

6. Глутатион-8-трансферазы

7. Обонятельные рецепторы и одорант-связывающие белки

8. Десатуразы жирных кислот

9. Нейропептиды

10. Метагеном ЬаБШБ niger_

10.1. Контаминация генома чёрного садового муравья

10.2. Сравнение состава бактерий между метагеномами муравьев из городских и природных местообитаний

10.3. Сравнение состава грибов между метагеномами муравьев из городских и природных местообитаний

10.4. Сравнение вирусного состава между метагеномами муравьев из

городских и природных местообитаний

11. Отличия в частотах аллелей и следы естественного отбора

между городскими и природными популяциями муравьев

ОБСУЖДЕНИЕ

1. Амплификация CYP9 как преадаптация к городским условиям,

2. Потери генов обонятельной системы в связи с увеличением числа генов системы детоксикации

3. Увеличение числа транспозонов и связь с увеличением числа генов, отвечающих за репарацию ДНК

4. Жирные кислоты во внутривидовой коммуникации муравьев

5. Морфологические различия внутри рода Lasius и различия по системе Hippo/Fat

6. Различия в генах иммунной системы между городскими и природными популяциями L. niger

7. Бактериальный и грибной микробиом L. niger и различия в микробиоте у муравьев из г. Москва и Московской области

8. L. niger как возможный переносчик вирусов растений и животных

ВЫВОДЫ

БЛАГОДАРНОСТИ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ

Введение диссертации (часть автореферата) на тему «Изучение адаптации и преадаптации муравьев Lasius niger к урбанизированной среде методами молекулярной экологии»

Актуальность работы

Изучение антропогенной эволюции важно как с точки зрения прикладной, так и фундаментальной науки. Человеку необходимо уметь предсказывать изменения экосистем для рационального природопользования. Для этого необходимо узнать, как ведут себя живые организмы при трансформировании человеком естественных экосистем. Городская среда сильно отличается от окружающих её естественных биотопов (Robinson, 1996), урбанизация кардинально меняет существующие экосистемы, что заставляет обитающие в ней виды адаптироваться к новым условиям среды. Задачa эволюционной биологии в данном случае — выявление общих закономерностей антропогенной эволюции и сравнение её с эволюционными процессами, не связанными с воздействием человека.

Насекомые являются объектом многих эволюционных исследований из-за удобной для изучения популяционной структуры и динамики, а также из-за своей хозяйственной значимости. Самой изученной темой в рамках антропогенной эволюции является проблема устойчивости насекомых к инсектицидам (Hoy et al., 1998, Hemigway et al., 2004, Amichot et al., 2004, Gatton et al., 2013, Gould, 1984, Scott et al, 1998) и её молекулярно-генетические основы, поскольку среди резистентных к пестицидам видов есть переносчики заболеваний человека, вредители и инвазивные виды.

К настоящему времени накопилось множество работ, выявивших закономерности и различия в адаптации разных групп насекомых к городским условиям (Raupp et al., 2010, Еремеева, Сущев, 2005, Connor et al., 2002, Boussaa et al., 2005), однако лишь немногие из них изучали данные процессы на генетическом уровне, и только одно исследование проводилось в масштабе полного генома (Asgharian et al., 2015).

Предыдущие сравнительные исследования геномов муравьев проясняли механизмы кастовой дифференциации и полиэтизма (Bonasio et al., 2010, Mikheyev, Linksvayer, 2015), а также успех инвазивных видов (Wurm et al., 2011, Smith et al., 2011a) и изменения в физиологии, связанные с пищевой специализацией у муравьев-листорезов (Nygaard et al., 2011). Популяционно-генетические исследования помогли понять, как возникла полигиния у Solenopsis invicta при интродукции (Gotzek, Ross, 2007).

Чёрный садовый муравей Lasius niger — распространённый в палеарктике вид, является одним из самых изученных видов семейства Formicidae (Hymenoptera). В сообществах муравьев многих городов Европы он является доминантом, его численность в городских биотопах может даже увеличиваться (см. рис. 1) по сравнению с природными (Путятина, 2011, Антонов, 2013, Блинова, 2008, Czechowski, Slipinski, 2008). Успех L. niger в городе пытались объяснить с особенностями питания и симбиозом с тлями, территориальным и гнездовым поведением (Путятина, 2011). Однако для изучения антропогенной эволюции необходимо знать её генетические основы, чтобы оценить роль естественного отбора в формировании адаптаций. Сравнение генома L. niger с другими известными геномами муравьев помогает выявить возможные преадаптации и особенности генома и связать их с особенностями биологии и экологии вида, как это было ранее сделано, например, для S. invicta (Wurm et al., 2011) и Linepithema humile (Smith et al., 2011a).

Получение полного генома данного вида не только позволяет определить генетические основы его адаптаций к городским условиям, но и сильно помогает в молекулярно-генетических исследованиях данного вида с помощью методов, основанных на ПЦР, и транскриптомного анализа. Все остальные виды муравьев с известными геномами (Bonasio et al., 2010, Smith et al., 2011a, Smith et al., 2011b, Smith et al., 2015, Nygaard et

al., 2011, Suen et al., 2011, Wurm et al., 2011, Oxley et al., 2014) являются либо узкоспециализированными, либо инвазивными видами, ни один из них не обладает таким широким естественным ареалом, кроме того, ни один из них не является нативным для палеарктического региона.

Рисунок 1. Встречаемость муравьев в г. Москве и Московской области (из Коноров, Путятина, 2013)

Получение полного генома данного вида не только позволяет определить генетические основы его адаптаций к городским условиям, но и сильно помогает в молекулярно-генетических исследованиях данного вида с помощью методов, основанных на ПЦР, и транскриптомного анализа. Все остальные виды муравьев с известными геномами (Bonasio et al., 2010, Smith et al., 2011a, Smith et al., 2011b, Smith et al., 2015, Nygaard et al., 2011, Suen et al., 2011, Wurm et al., 2011, Oxley et al., 2014) являются либо узкоспециализированными, либо инвазивными видами, ни один из них не обладает таким широким естественным ареалом, кроме того, ни один из них не является нативным для палеарктического региона.

Микробиом L. niger малоизучен. При этом городская среда может приводить к изменению состава и соотношения микробиоты насекомых и их жилищ, создавая таким образом новые условия, к которым нужно

адаптироваться. Например, известно, что при увеличении загрязнения окружающей среды снижается число Actinomyces в гнёздах L. niger (P^tal-Figielska, 1998), в то время как актиномицеты могут служить защитой от патогенов для муравьев рода Lasius (Kost et al., 2007). Метагеномика обладает многими преимуществами перед классическими микробиологическими методами, поскольку позволяет выявить некультивируемые виды и определить соотношение микроорганизмов в образце (Handelsman, 2004).

Таким образом, для изучения молекулярно-генетических основ адаптации насекомых к городу сравнение метагеномов и полных геномов L. niger из городских и природных биотопов подходит как с точки зрения выбора объекта, так и с точки зрения метода.

Целью данной работы является изучение адаптации и преадаптации L. niger к урбанизированным биотопам на геномном и метагеномном уровне.

Задачи

1. Сравнить геном L. niger с другими известными геномами муравьев по генным семействам, ранее изученным у перепончатокрылых и представляющим интерес с точки зрения адаптации к городским условиям.

2. Сравнить геномы муравьев L. niger из природных и городских популяций по частотам однонуклеотидных полиморфизмов.

3. Сравнить бактериальный, грибной и вирусный метагеном муравьев L. niger из городских и природных популяций.

Положения, выносимые на защиту

1. Цитохромы p450 девятого семейства у Lasius niger, как и у других

муравьев, находятся под действием положительного и

диверсифицирующего отбора и выполняют функцию детоксикации фито- и микотоксинов.

2. Амплификацию цитохромов p450 девятого семейства L. niger следует рассматривать как преадаптацию к урбанизированным биотопам из-за потенциального расширения спектра питания и увеличения устойчивости к грибковым заболеваниям.

3. В линии, ведущей к Lasius niger, происходили потери генов обонятельной системы. Уменьшение числа генов обонятельной системы у L. niger по сравнению с другими муравьями можно считать следствием увеличения числа цитохромов p450 и взаимными ограничениями между поведенческим и физиологическим путём адаптации к репеллентам и ксенобиотикам.

4. Потери генов обонятельной системы можно считать преадаптацией к городским условиям из-за приобретения устойчивости к растительным и искусственным репеллентам.

5. У L. niger в геноме найдено больше, чем у других муравьев с известными геномами LTR ретротранспозонов, часть из которых отличается по однонуклеотидным полиморфизмам между городскими и природными популяциями муравьев. Часть различий в генах ретротранспозонов L. niger может быть результатом действия естественного отбора.

6. Увеличение по сравнению с другими муравьями числа генов с доменами, отвечающими за репарацию ДНК, могло быть причиной увеличения числа ретротранспозонов.

7. Между городскими и природными популяциями L. niger обнаружен естественный отбор по генам синтаз жирных кислот и генам, участвующим в иммунном ответе. Также между городскими и природными популяциями по частотам однонуклеотидных полиморфизмов отличаются элементы сигнального пути Hippo/Fat.

8. Потенциально патогенные бактерии рода Spiroplasma присутствуют в метагеноме муравьев из городских популяций, но отсутствуют в микробиоме муравьев из природных популяций, что может быть связано с лучшими условиями в городе для тлей, которые могут участвовать в передаче данных бактерий муравьям согласно литературным данным.

9. В метагеноме муравьев L. niger, даже у тех, что выращены в лабораторных условиях, присутствуют грибы, участвующие в образовании арбускулярной микоризы (роды Acaulospora, Glomus, Paraglomus, Pleistophora). У городских муравьев в отличие от муравьев из природных местообитаний, в микробиоме присутствуют грибы рода Paraglomus и семейства Ophiocordycepitaceae, а также незначительно увеличивается доля рода Trichoderma и уменьшается доля Saccharomyces.

10.Вирусный метагеном Lasius niger из городских и природных популяций отличается по числу энтомопатогенных вирусов таких, как альфабакуловирусы, иридовирусы и асковирус 3a Heliothis virescens, а также по количеству вируса осповакцины.

11.L. niger может служить переносчиком для патогенных вирусов животных (вирус осповакцины, вирус Шамонды) и растений (вирус жёлтой мозаики цуккини и вирус хлоротической пятнистости перца).

Научная новизна работы

Автором впервые проведена функциональная аннотация генома чёрного садового муравья. Это четырнадцатый из известных геномов насекомых семейства Formicidae, второй для подсемейства Formicinae и первый из геномов муравьев, естественных для палеарктического региона. Также получена сборка генома L. flavus невысокого качества.

Впервые описаны цитохромы p450, обонятельные белки, одорант-связывающие белки, десатуразы жирных кислот, нейропептиды, глутатион S-трансферазы чёрного садового муравья и другие генетические системы, которым ранее (Smith et al., 2011a, Bonasio et al., 2010, Wurm et al., 2011, Simola et al., 2014) приписывалась роль в расширении спектра питания и формировании особенностей поведения и экологии муравьев. Для цитохромов p450 девятого семейства впервые произведено предсказание функции детоксикации фито- и микотоксинов с помощью молекулярного моделирования. Обнаружены следы естественного отбора на аминокислотные остатки, обеспечивающие устойчивый комплекс белок-лиганд для CYP9 муравьев.

Проведено одно из немногих полногеномных сравнений между городскими и природными популяциями вида на материале L. niger, а также одно из немногих сравнений метагеномов между популяциями одного вида муравьев (и первое, посвящённое проблеме изменений микробиоты при адаптации насекомых к городским условиям). Полученные результаты позволяют сделать вывод о важности иммунной системы при адаптации муравьев к городским условиям, ранее на этот аспект адаптации муравьев к городским условиям не обращали внимания, хотя было известно, что функциональный состав микробиоты в городской среде может меняться (P^tal-Figielska, 1998).

С помощью метагеномного анализа впервые описан состав вирусов чёрного садового муравья и выдвинута гипотеза о его возможной роли в переносе вирусов животных и растений.

Теоретическая и практическая значимость

Полученные результаты раскрывают возможные пути адаптации муравьев и других насекомых к городским условиям. Обнаруженные различия в доле энтомопатогенных микроорганизмов и вирусов вместе с

изменениями в генах иммунной системы муравьев из городских и природных популяций подтверждают необходимость изучения микробиоты при адаптации к сильным изменениям окружающей среды.

Данные молекулярного моделирования и докинга CYP9 L. niger с фито-, микотоксинами и инсектицидами позволяют предсказать низкую эффективность некоторых инсектицидов (в том числе растительного происхождения, таких как азадирахтин) по отношению к чёрному садовому муравью.

Аннотированный геном L. niger выложен в открытые базы данных и используется другими исследователями, в частности для построения филогении (Branstetter et al., 2017, фамилия автора упомянута в списке благодарностей). Геном служит основой для дальнейших молекулярно-генетических исследований, в частности в данный момент он используется нашей группой для подбора праймеров для ПЦР.

Данные метагеномного анализа говорят о том, что L. niger может являться переносчиком вируса Шамонды, вируса осповакцины, вируса жёлтой мозаики цуккини и вируса хлоротической пятнистости перца.

Личный вклад автора

Материал был собран Т.С. Путятиной, приготовление геномных библиотек осуществлялось С.Н. Лысенковым. Геном L. niger был собран К.В. Михайловым, коррекция и фильтрация чтений производилась М.Ю. Беленьким.

Фильтрация и коррекция чтений, а также сборка генома L. flavus произведена самим автором.

Оценка полноты сборки, функциональная аннотация генов L. niger, переаннотация с помощью BLAST2GO геномов других муравьев, сравнение представленности генных онтологий, выравнивание и

построение филогенетических деревьев генных семейств, поиск отбора в последовательностях производилась лично автором.

Поиск мобильных элементов, фильтрация химерных и бактериальных контигов, предсказание генов осуществлялась совместно с М.А. Никитиным.

Лично автором было проведено молекулярное моделирование, молекулярный докинг и виртуальный скрининг CYP9 муравьев.

Полногеномное сравнение популяций осуществлялось полностью самим автором.

Сравнение бактериальных и грибных метагеномов осуществлялось студентом М.Б. Адаевым под руководством автора, обсуждение результатов по сравнению микробиомов является совместной работой автора и М.Б. Адаева (с участием В.А. Скобеевой). Сравнение вирусных метагеномов, а также анализ метатранскриптомов производились автором лично.

Планирование эксперимента на начальных этапах осуществлялось В.А. Скобеевой и С.В. Нуждиным.

Апробация работы

Основные результаты данной работы были доложены и обсуждены на следующих конференциях:

1. 4-й Московская международная конференция "Молекулярная филогенетика MolPhy-4" (Москва, Россия, 23 - 25 сентября 2014 г.);

2. Евроазиатский симпозиум по перепончатокрылым насекомым (III симпозиум стран СНГ) (Нижний Новгород, Россия, 6 - 12 сентября 2015 г.);

3. Bioinformatics of Genome Regulation and Structure/BGRS-2016 (Новосибирск, Россия, 29 августа - 2 сентября 2016).

Публикации по теме диссертации

По материалам работы опубликовано 7 печатных работ, из них 3 — в научных журналах, рекомендованных ВАК РФ, 4 — в материалах международных и всероссийских конференций:

1. Коноров Е.А., Никитин М.А. Амплификация генов девятого семейства цитохромов p450 черного садового муравья Lasius niger как преадаптация к урбанизированным биотопам. // Молекулярная биология. 2015. Т. 49. № 3. С. 455-460.

(переводная версия) Konorov E.A., Nikitin M.A. Amplification of CYP9 genes as a preadaptation of the black garden ant Lasius niger to urban conditions // Molecular Biology (Russian). 2015. Vol. 49, №. 3. P. 403-407.

2. Коноров Е.А. Поиск следов естественного отбора между популяциями чёрного садового муравья Lasius niger из урбанизированных и природных биотопов // Генетика. 2018. Т. 54. № 2. С. 224-232.

(переводная версия) Konorov E. A. Genomic Signatures of Selection between Urban and Rural Populations of Black Garden Ant Lasius niger //Russian Journal of Genetics. 2018. Vol. 54. №. 2. P. 218-225.

3. Konorov E.A., Nikitin M.A., Mikhailov K.V., Lysenkov S. N., Belenky M. Yu., Chang P. L., Nuzhdin S.V., Scobeyeva V. A. Genomic exaptation enables Lasius niger adaptation to urban environments // BMC Evolutionary Biology. 2017. V. 17. №. 39 P. 39.

4. Коноров Е.А., Скобеева В.А. Что геном и транскриптом Lasius niger могут рассказать о его биологии? //Евроазиатский симпозиум по перепончатокрылым насекомым. Тезисы докладов. Издательство Нижегородского университета Нижний Новгород, 2015. С. 81-82.

5. Путятина Т.С., Коноров Е.А. Биотопическое распределение муравьев на территории Москвы 2005-2012 гг //Материалы XIV

Всероссийского мирмекологического симпозиума. Москва, 2013. С. 246-249.

6. Konorov E.A., Nikitin M.A., Mikhailov K.V., Scobeyeva V.A., Lysenkov S.N., Belenky M.Yu., Nuzhdin S.V. Amplification of CYP9 family of P450 cytochromes in Lasius niger: a preadaptation to urban environments? //Molecular Phylogenetics: Contributions to the 4th Moscow International Conference "Molecular Phylogenetics" (MolPhy-4), Moscow State University, Moscow, Russia. Moscow, Torus Press, 2014, p. 42

7. Konorov E.A., Scobeyeva V.A., Nikitin M.A. et al. Genome of black garden ant: defense against virus invasion? // The tenth international conference on bioinformatics of genome regulation and structure / systems biology. — Novosibirsk, Russia, 2016. — P. 142-142.

ОБЗОР ЛИТЕРАТУРЫ

1. Антропогенная эволюция насекомых

Изучение антропогенной эволюции важно как для фундаментальной эволюционной биологии и экологии, так и для многих прикладных задач. Прежде всего исследования в данной области должны ответить на вопрос, существуют ли принципиальные отличия между эволюцией, вызванной естественными факторами, и той, что вызвана деятельностью человека, можно ли интерполировать данные по адаптации организмов к трансформированным местообитаниям на изменения в нетронутой человеком среде.

Не менее важными являются вопросы о том, возможна ли вообще адаптация к антропогенным факторам, если да, то каким образом и как быстро происходит адаптация такого рода. При обобщении эмпирических данных в данной области следует выделять, если это возможно, общие особенности и закономерности антропогенной эволюции (Donihue, Lambert, 2015).

Насекомые в городских условиях изучались не только для решения фундаментальных проблем, но и прикладных задач, поскольку к антропогенным условиям адаптировались некоторые виды, причиняющие вред здоровью и имуществу человека, например, городские комары, термиты, муравьи-древоточцы (Robinson, 1996).

1.1. Факторы, влияющие на жизнь насекомых в городских условиях

Деятельность человека создаёт множество новых факторов и условий, к которым живым организмам приходится приспосабливаться. В ходе увеличения популяции человека и его хозяйственной активности многие естественные местообитания подвергаются разрушению и фрагментации. И уничтожение, и фрагментация местообитаний могут

приводить к снижению биоразнообразия (Lande, 1998, Tilman et al., 1994), однако фрагментация в некоторых случаях оказывает положительное влияние на биоразнообразие, создавая промежуточные местообитания. Краевой эффект может вызывать как уменьшение, так и повышение биоразнообразия (Fahrig, 2003, Tilman et al., 1994).

Разрушение и фрагментация местообитаний вкупе с загрязнением окружающей среды и чрезмерной эксплуатацией природных ресурсов приводит к снижению численности диких видов, не только фактической, но и эффективной (Lande, 1998, Okello et al., 2008). Это влечёт за собой исчерпание генетической изменчивости и увеличение доли инбридинга. Долгое время точное вычисление эффективной численности популяции было затруднительным, особенно в тех случаях, когда фактическая численность популяции сравнительно высока. Подсчёт эффективной численности долгое время производился лишь для тех видов, которые находятся под угрозой исчезновения. Проблема в том, что исчерпание генетической изменчивости, а, следовательно, и адаптивных возможностей происходит значительно раньше, чем достигается порог численности, за которым невозможно воспроизводство вида (Hare et al., 2011, Алтухов, 1995).

Урбанизация уничтожает или сильно изменяет сложившиеся сообщества растений и животных, однако вместе с этим создаёт новые местообитания. Часть видов сохраняется, но их обилие снижается, в то время как другие могут получать преимущества в новых условиях (Robinson, 1996).

Городская среда по сравнению с ненарушенными биотопами той же местности обладает рядом особенностей, способных оказывать влияние на биологию населяющих её животных, в частности, рекреационной нагрузкой, уменьшенным биоразнообразием, фрагментированностью местообитаний, повышенной концентрацией ксенобиотиков (поллютантов

и пестицидов), чуть более высокой температурой воздуха и изменённой влажностью почвы, уровнем шума (Robinson, 1996).

Наибольшее внимание в литературе уделяется влиянию этих факторов на насекомых, имеющих клиническую или хозяйственную значимость: кровососущих, жалящих насекомых, переносчиков заболеваний, вредителей имущества человека, инвазивные виды. Одной из самых изученных тем не только в рамках городской экологии, но и для эволюционной биологии вообще является адаптация насекомых к инсектицидам (Hoy et al., 1998). Многочисленные приспособления насекомых к токсинам можно разделить на две группы: поведенческие и физиологические. К первым относятся избегание ксенобиотика, смену пищевого или других форм поведения, приводящее к снижению эффекта от инсектицида. Поведенческие адаптации намного чаще являются полигенными, обычно возникают быстрее, чем физиологические, и являются менее доступными для изучения и моделирования (Gatton et al., 2013, Gould, 1984). Физиологические часто могут быть связаны с единственной мутацией в кодирующем регионе гена, продукт которого метаболизирует ксенобиотики (Hemigway et al., 2004, Amichot et al., 2004). В дальнейшем системы детоксикации будут рассмотрены более подробно.

Исследования антропогенной эволюции не ограничивались только изучением адаптации вредителей или приспособлениями к ксенобиотикам. Проводились также сравнения фаун разных групп насекомых между городскими и природными биотопами (Еремеева, Сущев, 2005, Connor et al., 2002, Boussaa et al., 2005, Niemela et al., 2002), выявлялись общие закономерности и отличия между эволюцией разных экологических и систематических групп насекомых к городским условиям. В ходе подобного анализа (Raupp et al., 2010) было выявлено, что многие мелкие фитофаги с ограниченной мобильностью (червецы, тли, галлицы) становятся более обильными при увеличении градиента урбанизации, а

червецы и клещи, в отличие от многих других членистоногих повышают численность при воздействии пестицидов.

Воздействие городской среды изучалось в том числе и на муравьях. В частности, исследовалось влияние инвазивных видов, влажности почвы и количества растительности на число видов сообщества муравьев в парках Сан-Франциско (Clarke et al., 2008), при этом было показано, что естественные лесные участки в парковых зонах повышают обилие и разнообразие муравьёв, в то время как искусственные насаждения снижают и то, и другое. Подобный результат был получен в работах других исследователей (Uno et al., 2010, Pacheco, Vasconcelos, 2007).

Проводились исследования воздействия загрязнения и рекреационной нагрузки на состав и структуру сообществ муравьев (Блинова, 2007, Блинова, 2008), в ходе которых было показано, что под воздействием данных факторов видовое разнообразие уменьшается, а также увеличивается доля подземных гнёзд при увеличении техногенной и рекреационной нагрузки. Похожий результат вызывает вытаптывание и кошение (Путятина, 2011). Помимо этого, изменяется устойчивость к температурным изменениям муравьев в условиях более тёплого городского климата по сравнению с расположенными недалеко природными биотопами (Angilletta et al., 2007).

Таким образом, адаптацию к городским условиям насекомых вообще и муравьев в частности нельзя назвать малоизученной темой, однако генетическим основам такой адаптации уделяется гораздо меньше внимания.

1.2. Генетические особенности адаптации насекомых в городе

Молекулярно-генетические основы адаптации к городским условиям для муравьёв не изучались. Популяционно-генетические исследования муравьёв в городе проводились для инвазивных видов: Linepithema humile

и двух видов рода Solenopsis, для которых было показано, что их экологический успех в интродуцированных областях связан с обеднением генетической изменчивости после бутылочного горлышка (Tsutsui, Case, 2002, Shoemaker et al., 2006). Для L. humile показано, что в нативном ареале данного муравья индексы фиксации между соседними семьями выше, а коэффициент родства внутри гнезда ниже, чем в интродуцированном ареале. В случае S. gemminata ключевым для последующей адаптации геном стал gp-9, ассоциированный с полигинией аллель которого закрепился при интродукции. Для близкого к нему S. invicta также наблюдается ассоциация разных аллелей с полигинией, причём среди факторов, влияющих на их частоты в разных популяциях, предполагается как сценарий бутылочного горлышка, так и балансирующий отбор (Gotzek, Ross, 2007). При этом успех видов муравьев, адаптировавшихся к городским условиям, также связывают с полигинией, однако в случае Tapinoma sessile обеднения генетической изменчивости в городской среде не происходило (Menke et al., 2010). Подобное наблюдалось и в случае Lasius neglectus, однако в данном случае авторы сочли отсутствие явного бутылочного горлышка артефактом из-за того, что не были найдены муравьи данного вида из природных местообитаний (Ugelvig et al., 2008). Случай с инвазивными L. humile и S. invicta является примером того, как сильный генетический дрейф может приводить к эволюционному успеху.

Селективные процессы на генном и геномном уровне широко изучались в контексте упоминавшейся уже адаптации к ксенобиотикам. Ассоциированными с устойчивостью к инсектицидам и загрязняющим веществам оказывались в разных исследованиях цитохромы P450 (Itokawa et al., 2013, Naqqash et al., 2016, Li et al., 2007), глутатион^-трансферазы, эстеразы (Naqqash et al., 2016, Li et al., 2007), натриевые каналы (Naqqash et al., 2016).

Остальные генетические основы антропогенной эволюции насекомых изучены гораздо меньше. Поскольку городская среда обладает комплексом факторов, отличающим её от природной, то и адаптация к ней ожидаемо будет комплексной, затрагивающей большое число генов. Выявление генов, находящихся под отбором, в таком случае потребует применения дорогостоящих методов популяционной геномики, которые будут описаны ниже.

Как минимум одно исследование по полногеномному сравнению частот аллелей и поиску отбора всё же проводилось на насекомых, а именно на комаре Culexpipiens (Asgharian et al., 2015). Между городскими и природными популяциями были обнаружены следы естественного отбора по цитохромам p450, шаперонинам и белкам теплового шока, супероксиддисмутазам, вителлогенинам, кадгеринам, факторам ремоделирования хроматина и гистонам. Последнее особенно неожиданно, поскольку последовательность гистонов считается высоко консервативной.

Таким образом, из-за небольшого числа популяционно-геномных исследований по антропогенной эволюции насекомых сложно судить, какие гены окажутся под отбором у того или иного вида насекомых, освоившего трансформированные экосистемы.

Похожие диссертационные работы по специальности «Энтомология», 03.02.05 шифр ВАК

Список литературы диссертационного исследования кандидат наук Коноров Евгений Андреевич, 2018 год

_ - ¿д )

s '—J-J—

Уровень значимости, при котором нулевая гипотеза отвергается, будет зависеть от альтернативной гипотезы HA: a) dN Ф dS (тест на нейтральность),

b) dN > dS (тест на положительный отбор),

c) dN < dS (тест на очищающий отбор).

Для альтернативных гипотез (b) и (с) используется односторонний тест, для (a) используется двусторонний тест.

Для данных, содержащих более двух последовательностей, вычисляется среднее число синонимичных замен и среднее число несинонимичных замен для проведения Z-теста так, как описано выше. Дисперсия вычисляется при помощи бутстреп-метода (Nei, Kumar, 2000).

Постепенно появились методы, изучающие отбор по каждому кодону. Их можно разделить на три класса: первый, в который входят методы, подсчитывающие число синонимичных и несинонимичных сайтов по всей филогении (счетные методы), во второй входят методы, предполагающие определенные распределения уровней dN и dS по позициям в выравнивании, и выводят скорость замен для каждого остатка, учитывая данное распределение (модели со случайными эффектами), модели третьего класса рассчитывают соотношение числа синонимичных и несинонимичных замен для каждого сайта (модели с фиксированными эффектами) (Kosakovsky Pond, Frost, 2005).

Первый класс - счетные методы - подсчитывает число несинонимичных и синонимичных замен, возникших в каждом кодоне за всю эволюционную историю образца. Этот подход подразумевает реконструкцию предковой последовательности, используя метод максимальной экономии или макисмального правдоподобия. Эти методы быстры для вычисления и могут быть применены на больших объемах данных, и не предполагают какого-либо распределения dN и dS по сайтам. Однако они не имеют необходимой мощности, особенно для небольшого числа последовательностей или для последовательностей с низким уровнем дивергенции. Также подсчет числа замен между

последовательностью и предковым состоянием может недооценивать число реально имевших место замен (Kosakovsky-Pond, Frost, 2005).

Второй класс методов, включает построение распределения уровней замен по сайтам, а затем вычисляет уровни замен для каждого сайта. Если предполагаемое и истинное распределения похожи, то данный класс моделей имеет большую мощность, чем остальные два. Однако данные методы допускают существенные ошибки на небольшом числе последовательностей (Kosakovsky-Pond, Frost, 2005).

Третий класс вычисляет уровни замен для каждого сайта. Эти модели предполагают несколько классов сайтов, которые заведомо обладают разным соотношением dN/dS. Дальнейшие модели предполагали подсчет числа замен для каждого кодона, используя для проверки метод максимального правдоподобия или тест отношения правдоподобия. Как и модели первого класса, они не делают никаких предположений о распределении замен по сайтам. Данные методы более точные и более медленные, чем модели первого класса (Kosakovsky-Pond, Frost, 2005).

На основании моделей двух последних классов были предложены более современные модели со смешанными эффектами, основанные на branch-site моделях со случайными эффектами. Данные методы предполагают распределение dN/dS, меняющееся как по сайтам (как в моделях с фиксированными эффектами), так и между ветвями филогенетического дерева (как в моделях со случайными эффектами). Это позволяет одинаково хорошо улавливать следы как эпизодического, так и продолжительного отбора (Murell et al., 2012).

8. Молекулярное моделирование и его приложения в энтомологических исследованиях

8.1. Молекулярное моделирование, молекулярный докинг и виртуальный скрининг

Поскольку экспериментальное определение пространственной структуры белка — достаточно трудоёмкий процесс, белков с известной структурой значительно меньше, чем известных аминокислотных последовательностей. В связи с этим распространение получили методы моделирования трехмерной структуры белков.

Компьютерное предсказание структуры белков в зависимости от наличия структуры гомологичного белка делятся на две категории: моделирование с использованием известной структуры гомолога в качестве образца, и моделирование de novo.

Для предсказания структуры белка de novo разные методы для построения функции энергии между атомами используют в разной степени вычисления, основанные на квантовой механике и кулоновском потенциале, и эмпирические данные, полученные из баз данных белков с известными трехмерными структурами (Lee et al., 2009). Подход I-TASSER основан только на эмпирических данных, он использует метод «протягивания» — построения большого числа грубых моделей для данной последовательности с последующим улучшением топологии. Совпадения предсказанных белковых структур с нативной были выше 90%. Ранее данный метод был точным для относительно небольших последовательностей, впоследствии были разработаны дополнения для белков с несколькими доменами (Roy et al., 2010).

Подход моделирования по гомологии становится возможным на основании того, что небольшие изменения в аминокислотной последовательности обычно приводят к небольшим изменениям в структуре белка. Трехмерные структуры белков одного семейства более

консервативны, чем их аминокислотные последовательности. Данный подход производит модели, сравнимые по качеству с трехмерными структурами, полученными с помощью рентгеноструктурной кристаллографии низкого разрешения или методом ядерно-магнитного резонанса среднего разрешения. Одной из программ, осуществляющих моделирование по гомологии, является MODELLER (Eswar et al., 2008). Помимо моделирования структуры MODELLER имеет функцию оптимизации петель, не консервативных между гомологами, используя методы сопряженных градиентов и молекулярной динамики. Для этого он использует известную структуру гомолога и аминокислотное выравнивание с ним интересующего белка.

Молекулярный докинг - предсказание конформации лиганда и его ориентации по отношению к активному центру исследуемого белка. Две важные компоненты для работы программы для докинга - хорошая оценочная функция и эффективный алгоритм для определения конформации и ориентации молекул. Оценочная функция отличает правдоподобные конформации от неестественных, подсчитывая свободную энергию связывания, основываясь на эмпирических, использующих информацию о экспериментально доказанных комплексах белок-лиганд, либо на физических методах. Одной из программ для докинга является Autodock Vina (Trott, Olson, 2009), использующая алгоритм оптимизации градиента, достаточно быстрый и точный (по сравнению с другими программами серии Autodock). Она использует метод машинного обучения по эмпирическим данным для построения оценочной функции. Другим примером может служит GEMDOCK (Yang, Chen, 2004), использующий эволюционный алгоритм и эмпирическую оценочную функцию с расчетом электростатических, стерических и водородных потенциалов.

Виртуальный скрининг - это метод, позволяющий предсказать связывание лиганда с белком на основании пространственной структуры данных соединений. Получая на входе структуру исследуемого белка и базу данных возможных лигандов, данный метод предсказывает сродство и способ связывания лиганда и белка и определяет соединения, с которыми белок с наибольшей вероятностью вступает во взаимодействие. Виртуальный скрининг использует результаты молекулярного докинга и вычисляет оценочную функцию свободной энергии (в разных программах либо на основании эмпирических, либо теоретических моделей). Программа GEMDOCK (и программа iGEMDOCK с графической средой) имеет возможность постдокингового анализа и ранжирования предсказанных лиганд-белковых комплексов по свободной энергии (Yang, Shen, 2005).

8.2. Приложения молекулярного докинга в энтомологии

Несмотря на то, что большинство работ в области определения структуры белка проводится на млекопитающих или бактериях, довольно большое число структур (более полутора тысяч вхождений в базе данных RCSB PDB, Kouranov et al., 2006) определено экспериментальными методами и для насекомых (Cornet et al., 1995, Graether et al., 2000, Huber et al., 1987). Поскольку также есть структуры белков других организмов, не так сильно разошедшихся с таковыми у насекомых, основа для изучения структур и функций белков насекомых довольно большая.

Как и в случае с генетическими, физиологическими и молекулярно-биологическими исследованиями, довольно изученной темой в данной области является моделирование взаимодействий белков систем детоксикации с лигандами-инсектицидами. Причинами повышенного внимания к этой теме является актуальность проблемы устойчивости к пестицидам и относительная простота моделирования вследствие обычно

известной структуры лиганда, часто низкомолекулярного. В частности, в нескольких работах изучались взаимодействия цитохромов p450 с инсектицидами (Chandor-Proust et al., 2013, Jones et al., 2010, Niu et al., 2011) и другими ксенобиотиками, например, фитотоксинами (Baudry et al., 2003, Wen et al., 2005). Подобные исследования позволили определить вклад конкретных аминокислотных остатков в функцию белка.

Изучалось также взаимодействие инсектицидов с белками-мишенями, против которых они направлены. Например, изучалось связывание имидахлорида и его метаболитов с никотиновым ацетилхолиновым рецептором nAChR (Rocher, Marchand-Geneste, 2008), ДДТ и пиретроидов с потенциал-зависимыми натриевыми каналами (O'Reilly et al., 2006), различных инсектицидов с ГАМК рецепторами (Law, Lightstone, 2008). Результаты данных работ позволяют уточнить механизм действия инсектицидов, найти конкретные сайты связывания с ними, определить возможности для адаптации к инсектицидам путём изменения белка-мишени.

Изучение взаимодействий белков насекомых с низкомолекулярными соединениями не ограничивалось только исследованиями действия инсектицидов и ксенобиотиков. Например, метод молекулярного докинга применялся для поиска мишеней экдизона и других экдистероидов (Harada et al., 2011, Sasorith et al., 2002).

Число исследований с использованием молекулярного докинга и виртуального скрининга растёт из-за быстроты и низких затрат ресурсов. Данный подход может быть единственным вариантом при необходимости определить, какой лиганд из большой базы данных соединений лучше взаимодействует с белком, как в случае со скринингом лекарств. Однако докинг может давать неверные результаты в случае неправильного выбора сайтов связывания или отсутствия длительной симуляции молекулярной

динамики. Также не всегда ясно, является ли отобранная молекула лигандом или ингибитором (Chen, 2015).

МАТЕРИАЛЫ И МЕТОДЫ

1. Сбор материала.

Для секвенирования генома рабочие особи L. niger были взяты из двух локаций: на территории МГУ и из Истринского района Московской области. Из каждой локации (см. табл. 1) были собраны эксгаустером муравьи из трех мест (из пяти гнезд в каждом) и зафиксированы в 98% этаноле в начале сентября 2011. После этого образцы подверглись сухой заморозке и были перевезены в Университет Южной Калифорнии.

Из каждой выборки были приготовлены библиотеки геномной ДНК и прочтены как парноконцевые чтения длиной 100 пар оснований на Illumina HiSeq 2500. Каждая библиотека была помечена баркодом. На выходе получены 423 миллионов чтений ДНК из объединенных библиотек.

Таблица 1. Объемы выборок и места сбора материала.

Номер выборки Локация Объем выборки

1 Истринский район Московской области 76

2 Истринский район Московской области 74

3 Истринский район Московской области 71

4 Территория МГУ, г. Москва 69

5 Мичуринский проспект, г. Москва 75

6 Парк Воробьевы горы, г. Москва 45

Для секвенирования транскриптома были собраны отдельно рабочие муравьи, самка и самцы L. niger с территории кампуса Московского университета в RNAlater. РНК выделялась с помощью RNA isolation kit. Транскриптом был отсеквенирован на платформе Illumina MiSeq (использованы парноконцевые чтения длиной 250 пар оснований).

Для сборки генома L. flavus были собраны рабочие муравьи в 98% этанол. Были приготовлены библиотеки геномной ДНК и прочтены как парноконцевые риды длиной 250 пар оснований на Illumina MiSeq.

2. Сборка генома Lasius niger.

С помощью программы Trimmomatic v0.33 (Bolger et al., 2014) были произведены фильтрация чтений и удаление адаптерных последовательностей, после этого геном был собран с помощью SPAdes (Bankevich et al., 2012) сотрудником Института Физико-химической биологии им. А.Н. Белозерского МГУ Кириллом Михайловым.

Параметры сборки генома:

Число скаффолдов длиной более 500 пар оснований - 41406.

Медианная длина скаффолда - 16382 пар оснований.

Наибольшая длина скаффолда - 167361 пар оснований.

Общий размер сборки генома (исключая скаффолды, меньшие 500 пар оснований) - 245317338 пар оснований.

Короткие чтения и полученная сборка были загружены в базу данных при NCBI под идентификационным номером BioProject PRJNA171386.

Произведена проверка полноты сборки генома с использованием программ CEGMA (Parra et al., 2007) и BUSCO (Simâo et al., 2015). Оценка полноты генома с помощью CEGMA составляла 98,8%. По результату сравнительного анализа универсальных ортологов оказалось, что 75,9% универсальных ортологов присутствуют хотя бы в одной копии (6,9%

дуплицированы), 14,7% присутствуют в фрагментированном виде, не обнаружен 251 (9,4%) универсальный ортолог. По обоим показателям сборка получилась достаточно хорошего качества для анализа и сравнения с другими видами.

3. Источники кодирующих и предсказанных белковых последовательностей остальных видов, включенных в анализ.

Аннотированные предсказанные белковые последовательности и соответствующие им кодирующие последовательности ДНК исследуемых генных семейств (цитохромы P450, обонятельные рецепторы, одорант-связывающие белки, десатуразы, различные семейства нейропептидов и рецепторов к ним, глутатион трансферазы) C. biroi, M. pharaonis, V. emeryi, W. auropucntata были взяты из базы данных GenBank, A. mellifera и N. vitripennis - из базы данных RefSeq. Последовательности десатураз, нейропептидов и рецепторов к нейропептидам D. melanogaster также взяты из базы данных Refseq.

Все предсказанные белковые и соответствующие им кодирующие последовательности S. invicta, A. cephalotes, L. humile, P. barbatus, C. floridanus, C. obscuritor, A. echinatior и H. saltator в неаннотированном виде были получены из базы данных геномов перепончатокрылых Hymenoptera Genome Database (Munoz-Torres et al., 2010).

Использованный для метагеномного анализа транскриптом рабочих муравьев, выращенных в лабораторных условиях, был получен из архива коротких чтений NCBI, идентификационный номер в базе данных BioProject PRJNA352917.

4. Предсказание генов и функциональная аннотация.

Для предсказания границ генов была использована программа Augustus (Stanke, Morgenstern, 2005). Были использованы следующие

параметры запуска: в качестве обучающей выборки для Augustus был взят наездник с уже известными границами генов Nasonia vitripennis (отр. Hymenoptera, сем. Pteromalidae), предсказание генов шло в обеих цепях ДНК, было возможно предсказание фрагментированных (не поместившихся на скаффолде) генов. Полученный GFF-файл был преобразован в fasta-файл с предсказанными аминокислотными последовательностями продуктов генов.

Для поиска похожих последовательностей была применена программа blastp локально по базе данных refseq_protein. Были составлены базы данных последовательностей C. biroi, M .pharaonis, V. emeryi, W. auropucntata, C. floridanus, A. echinatior, H. saltator, A. mellifera, N. vitripennis, D. melanogaster (последовательности последней использовались только для десатураз, нейропептидов и рецепторов к нейропептидам) отдельно для следующих генных семейств: цитохромы P450, обонятельные рецепторы, одорант-связывающие белки, десатуразы, 30 семейств/подсемейств нейропептидов и рецепторов к ним, глутатион трансферазы.

По вышеупомянутым базам данных произведен поиск похожих последовательностей с помощью программы BLASTP для всех предсказанных белковых последовательностей L. niger, S. invicta, A. cephalotes, L. humile, P. barbatus. Было установлено ограничение по e-значению в 10-5. Для всех последовательностей, отобранных по результатам данного запуска программы, был проведён проверочный запуск программы BLASTP по базе данных refseq_protein.

Все найденные таким образом последовательности были выровнены отдельно для каждого генного семейства с помощью MUSCLE, входящего в состав пакета MEGA6.0 (Tamura et al., 2013). По полученным множественным выравниваниям были построены профили hmm (скрытых марковских моделей) и для каждого сравниваемого вида был осуществлён

поиск последовательностей соответствующих генных семейств с помощью HMMER (Eddy, 2009). Также был произведён дополнительный поиск генов цитохромов p450, обонятельных рецепторов, одорант-связывающих белков с помощью TBLASTX по геному чёрного садового муравья, используя в качестве запроса известные белковые последовательности соответствующих продуктов генов других муравьев, A. mellifera, N. vitripennis и D. melanogaster.

Подобным образом с помощью BLASTP и HMMER осуществлялся поиск ретровирусных белков (gag, pol, env) в геномах муравьёв.

Был проведена также функциональная аннотация с помощью программы Blast2GO (картирование и аннотация генных онтологий для каждого гена, поиск генных онтологий с помощью InterProScan) для всех геномов муравьев для сравнения по представленности генных онтологий. Для L. niger был произведен поиск генных онтологий, представленных меньше или больше, чем в других геномах муравьев. Статистическая значимость отличий определялась с помощью Q-теста Диксона. Число генов в каждой генной онтологии было поделено на общее число генов отдельного вида и преобразовано с помощью арксинуса для получения нормального распределения (Schwarz, 2007). сравнение по представленности генных онтологий проводилось для L. niger, C. floridanus, H. saltator, L. humile, C. biroi, P. barbatus, S. invicta, A. cephalotes и A. echinatior, не были включены M. pharaonis, V. emeryi, W. auropunctata и C. obscurior. Также для данных видов не был произведён поиск нейропептидов и рецепторов к ним.

5. Фильтрация материала перед выравниванием.

Последовательности с известными старт- и стоп-кодонами, но длиной, меньшей, чем 75% предположительной длины белкового продукта (для цитохромов P450 и обонятельных рецепторов предположительная

длина продукта 500 аминокислотных остатков, для десатураз - 300 аминокислотных остатков, принято округленное среднее значение длины полных соответствующих белков муравьев из баз данных) были исключены из последующего анализа, как возможные псевдогены.

Фрагментарные последовательности, длиной менее 250 аминокислотных остатков для цитохромов P450 и обонятельных рецепторов и менее 150 аминокислотных остатков для десатураз были исключены из анализа, потому что иначе могли возникнуть сравнения двух фрагментов одного гена как разных генов.

Для обонятельных рецепторов использовались все последовательности, за исключением белков муравьев, близких по результатам поиска с помощью BLASTP к 0г170 и Or2 A. mellifera (из-за высокого отличия последовательностей, близкого к различию между семействами белков). С помощью метода максимального правдоподобия были построены деревья в пакете MEGA6.0.

Для построения деревьев и дальнейшего поиска отбора в семействе цитохромов P450 не использовались те последовательности, в которых не присутствовал мотив Phe-X-X-Gly-X-Arg-X-Cys-X-Gly, необходимый для стабилизации железа гема.

6. Выравнивание последовательностей и построение филогенетических деревьев.

Отобранные предсказанные белковые последовательности цитохромов P450, обонятельных рецепторов и десатураз внутри каждого семейства были выровнены с помощью программы MUSCLE, входящей в пакет MEGA6.0. В семействе цитохромов P450 отдельно были выровнены последовательности, принадлежащие к подсемействам CYP4, CYP6 и CYP9. Для построения деревьев использовались последовательности CYP длиной больше 250 аминокислот, но только те из них, которые имели

мотив Phe-X-X-Gly-X-Arg-X-Cys-X-Gly, чтобы избежать сравнения нефункциональных генов с функциональными.

Для построения филогенетического дерева десатураз не были включены последовательности V. emeryi, M. pharaonis, W. auropunctata и C. obscurior.

Для каждого из построенных выравниваний было построено дерево методом максимального правдоподобия с помощью пакета MEGA6.0 с использованием следующих параметров: модель замен подбиралась по минимальному BIC, число реплик бутстрепа — 500, начальное дерево строилось методом присоединения ближайшего соседа.

7. Детекция отбора.

Для выявления генов, подверженных отбору был проведен попарный Z-тест, входящий в пакет MEGA6.0. Последовательности, для которых отвергалась гипотеза о нейтральности и очищающем отборе и не отвергалась гипотеза о положительном отборе, считались подверженными положительному отбору. Случаев, при которых отвергалась гипотеза о положительном отборе, не было среди цитохромов p450, обонятельных рецепторов и десатураз муравьев.

Для семейства CYP9 были отобраны исключительно полные кодирующие последовательности длиной от 1425 до 1800 нуклеотидов, имеющие старт- и стоп-кодоны. После удаления стоп-кодонов последовательности выровнялись покодонно с помощью программы MUSCLE, входящей в пакет MEGA6.0. С помощью метода максимального правдоподобия в пакете MEGA6.0 были построены филогенетические деревья (число реплик бутстрэпа 1000, модель замен подбиралась по минимальному BIC, вычисленному с помощью MEGA6.0), на основании которых производился дальнейший поиск отбора. В пакете HyPhy2.2.0 методами SLAC, FEL (Kosakovsky Pond et al., 2005), FUBAR (Murell et al.,

2013) и MEME (Murell et al., 2012) был произведен поиск отбора для каждого кодона в данном выравнивании. Реконструкция предковых последовательностей и подсчёт числа аминокислотных замен по филогении производились с помощью SLAC.

8. Моделирование белков по предсказанным аминокислотным последовательностям.

Для моделирования предсказанных белков CYP9 L. niger g7627 (KMQ92393.1), g7628 (KMQ92392.1) методом протягивания по аминокислотным последовательностям использовалась программа I-TASSER (Zhang, 2008).

Предсказанные белковые последовательности CYP9, принадлежащие L. niger (KMQ96342.1/g3383, KMQ94344.1/g5510, KMQ93458.1/g6437, KMQ91031.1/g9153, KMQ88546.1/g11948, KMQ89602.1/g10753, KMQ88037.1/g12549, KMQ89601.1/g10752), C.floridanus (EFN61084.1/CFL011634-RA, EFN61085.1/ CFLO11633-RA, EFN63658.1/CFL011366-RA, EFN63656.1/CFL011363-RA), H. saltator (EFN77007.1/HSAL18955-RA, EFN77005.1/HSAL18957-RA, EFN79704.1/ HSAL18950-RA, EFN77009.1/HSAL11619-RA, EFN77010.1/HSAL18954-RA), O. biroi (EZA57476.1, EZA57484.1), A. echinatior (EGI69994.1) и S. invicta (EFZ09702.1/SINV20322-RA), были выровнены с g7627 и были смоделированы с помощью программы MODELLER 9.13 (Eswar et al., 2008), входящей в пакет UCSF Chimera методом моделирования по гомологии с моделью g7627, полученной с помощью I-TASSER. Далее с помощью той же программы производилось улучшение петель в области предполагаемого активного центра.

Для всех моделей с помощью программы Autodock Vina, встроенной в пакет UCSF Chimera в полученные модели помещался гем (модель

ZINC26671872 из базы данных ZINC) так, чтобы железо было рядом с цистеином из мотива Phe-X-X-Gly-X-Arg-X-Cys-X-Gly.

Далее в приложении Swiss-PdbViewer из модели удаляли всё, кроме гема и окружающих его аминокислотных остатков на расстоянии 10Á, получая предполагаемые активный центр и лиганд-связывающий карман.

9. Молекулярный докинг и виртуальный скрининг.

Из базы данных ZINC были отобраны 188 моделей соединений, которые предполагались возможными лигандами к цитохромам P450 девятого семейства. Среди них были различные пестициды, инсектициды, микотоксины, жирные кислоты, аминокислоты, моносахариды и другие биологически активные органические соединения (полный список приведён в приложении, таблица 1).

Для каждой из 23 моделей (включающих только гем и аминокислотные остатки на расстоянии 10Á от него) продуктов генов цитохромов p450 был произведен молекулярный докинг и последующий виртуальный скрининг вышеупомянутых 188 соединений с помощью программы iGEMDOCK (параметры запуска: «размер популяции»: 800, число «поколений»: 80; примечание: приведенные параметры относятся к «эволюционному» алгоритму программы iGEMDOCK, настройкам для более медленного, но точного докинга). Для каждой пары белок-лиганд было получено 10 решений их совместного пространственного расположения и взаимодействия.

Далее были отобраны комплексы, в которых лиганд находится над плоскостью гема (по обратную сторону от стабилизирующего железо цистеина) и не перекрывается с ним или петлями белка, а также свободная энергия которых была ниже -100 кал/моль. Последнее ограничение введено исходя из работ исследователей, использовавших iGEMDOCK (Raghav, Singh, 2014; Li et al., 2013), оно несколько ниже, чем у веществ,

для которых данные исследования экспериментально подтвердили связывания с белком, однако позволяет избежать многих ложноположительных результатов.

Для всех химических веществ, используемых в качестве лигандов, были получены онтологии из базы данных ChEBI (Degtyarenko et al., 2007), после этого с помощью точного теста Фишера было проведено сравнение представленности соответствующих онтологий в отобранных комплексах (всех вместе и отдельно для комплексов лигандов с моделями белков CYP9 L. niger) с их представленностью во всех возможных комбинациях белок-лиганд (все 23 модели белков со всеми 188 лигандами).

10. Полногеномное сравнение популяций

Короткие чтения каждого из шести образцов (соответствующим выборкам из табл. 1) были картированы отдельно на геном чёрного садового муравья с помощью программы BWA (Li, Durbin, 2009). Поскольку покрытие каждого образца по отдельности было недостаточным для сравнения (6,6x, 8,6x, 3,2x для образцов из Московской области, 5,9x, 3,8x, 6,7x для образцов из города Москвы), полученные BAM файлы были объединены отдельно для городских и природных образцов. Среднее покрытие городской выборки составило 10,4x, для объединённой выборки из Московской области — 15x.

С помощью пакета PoPoolation (Koffler et al., 2011a) был рассчитан D Таджимы для каждого гена. Использовалась генная аннотация, полученная с помощью Augustus. С помощью PoPoolation2 (Koffler et al., 2011b) для каждого гена были рассчитаны частоты аллелей, Fst, и проведён статистический анализ значимости различий по частотам аллелей между популяциями из Москвы и Московской области с помощью точного теста Фишера. Использовались следующие параметры для обеих программ:

минимальное покрытие 4, максимальное покрытие 200, длина «скользящего окна» 50000.

Было проведено сравнению по представленности генных онтологий среди генов, частоты которых значимо отличались по спектру аллелей между популяциями по результатам точного теста Фишера, по сравнению с представленностью генных онтологий среди всех генов L. niger. Для этого были использованы точный тест Фишера и программа Blast2GO v2.8 (Conesa et al., 2005).

11. Метагеномный анализ

Изначально геномные библиотеки из городских и природных популяций не предназначались для метагеномного анализа, однако из-за отсутствия фазы очистки от минорных компонентов ДНК при приготовлении библиотек они были сочтены пригодными для анализа микробиоты. Были проанализированы отдельно метагеномы шести образцов L. niger из Москвы и Московской области. Также были использованы для метагеномного анализа транскриптомы чёрных садовых муравьев, собранных в Москве и выращенных в лабораторных условиях (по последним данные взяты из архива коротких чтений NCBI).

Для локального выравнивания коротких чтений была использована программа BLASTN, с е-значением равным 0.001 (остальные параметры -по умолчанию). Поиск соответствия осуществлялся по базам данных Fungal 18S Ribosomal RNA (SSU) RefSeq Targeted Loci Project и 16S ribosomal RNA Targeted Loci Project, а также объединённым базам данных RefSeq вирусных геномов.

Полученные выравнивания были проанализированы с помощью программы MEGAN v.5.10.6. Число прочтений, отнесённых к каждому таксону, было нормировано квадратным корнем (McMurdie, Holmes, 2014), как рекомендовано разработчиками программы (Huson, 2007). Анализ

производился только по тем таксонам бактерий, грибов и вирусов, для которых ненормированное число картированных чтений превышало 25, поскольку единичные нахождения какого-либо организма могут быть артефактом биоинформатического анализа или контаминацией.

РЕЗУЛЬТАТЫ

1. Параметры сборки генома

Общая длина сборки генома чёрного садового муравья составляет 245 млн. пар оснований, медианная длина контига (N50) равна 16382 п.о., оценка полноты сборки по CEGMA составляет 98,8%. Данные значения сопоставимы с качеством сборок других муравьев с известными геномами, что делает возможным сравнительный анализ геномов. По результатам генной аннотации у Ь. niger обнаружилось 31823 гена, из них 18794 -полные, то есть с найденным началом и стоп-кодоном (9126 - в прямом направлении, 9668 - в обратном). После удаления контигов, длиной меньшей, чем 1000 пар оснований, а также тех, которые по результатам поиска BLASTN и BLASTP принадлежат грибам и бактериям, общее число генов составило 18247 (из них 12207 полные).

Геном Ь. Аоуш полон лишь на 72% (92% учитывая частичные гены, CEGMA), медианная длина скаффолда составила всего 3,2 тысяч пар оснований, а наибольший скаффолд оказался длиной 30 тыс. п.о. При сборке генома Ь. Аоуш по референсному геному Ь. niger с помощью SAMtools 12,8% генома чёрного садового муравья оказались не покрыты чтениями и скаффолдами жёлтого садового муравья. Данные по геному Ь. Аоуш были использованы только для сравнения расположения в геноме СУР9.

2. Представленность генных онтологий

Анализ представленности генных онтологий в геноме чёрного садового муравья показал значимые отличия от других муравьёв по многим генным онтологиям (см. табл. 3).

Таблица 2. Параметры сборки генома L. niger в сравнении со сборками других муравьев с известными геномами (данные для других видов взяты из соответствующих статей, "-" в колонках означает отсутствие литературных данных по данному параметру). (с использованием данных Bonasio et al., 2010, Suen et al., 2011, Nygaard et al., 2011, Smith et al., 2011b, Smith et al., 2011a, Wurm et al., 2011, Mikheyev, Linksvayer, 2015, Smith et al., 2015, Schrader et al., 2015, Oxley et al., 2014).

Вид муравьев Размер сборки генома (в мегабазах) Медианная длина контига Среднее покрытие генома Полнота сборки (CEGMA) GC% Число генов

Lasius niger 245 16382 19x 98,8% 38 18247

Camponotus floridanus 236 24134 102x - 34 17064

Harpegnathos saltator 297 38027 104x - 45 18564

Linepithema humile 251 35858 23x 99% 38 16331

Acromyrmex echinatior 300 62705 123x 98% 34 17278

Atta cephalotes 290 14240 19x 98,8% 33 18093

Pogonomyrmex barbatus 235 11600 12x 99% 37 17177

Solenopsis invicta 353 14674 - 99,2% - 16569

Monomorium pharaonis 284 19000 40x 97% - -

Vollenhovia emeryi 269 - 11x - 42 26902

Oocera (Cerapachys) biroi 214 31934 122x 99,6 42 17263

Предсказанные белки L. niger содержит почти в два раза больше по сравнению с другими муравьями доменов, отвечающих за связывание с нуклеиновыми кислотами (G0:0003676 "nucleic acid binding"), каталитическую активность (G0:0003824 "catalytic activity"), связывание с рРНК (G0:0019843 "rRNA binding"), связывание с гетероциклическими соединениями (G0:1901363 "heterocyclic compound binding", транспорт хлора (G0:0006821 "chloride transport"). Некоторые из перепредставленных у L. niger генных онтологий слишком общи (такие как G0:0005488 "binding", G0:0009987 "cellular process"), чтобы судить о возможных функциональных изменениях в протеоме чёрного садового муравья по сравнению с другими видами муравьев.

Таблица 3. Список генных онтологий, представленных среди генов Ь. niger значимо больше или меньше по сравнению с другими муравьями.

ID генной онтологии Генная онтология Число генов с данной генной онтологией у L. niger Число генов с данной генной онтологией у других муравьев p-значение Q-теста Диксона

G0:0003676 nucleic acid binding 1683 от 587 до 996 p<0.01

G0:0005488 binding 436 от 131 до 194 p<0.01

G0:0003824 catalytic activity 207 от 111 до 137 p<0.01

G0:0006281 DNA repair 98 от 57 до 79 p<0.05

G0:0000287 magnesium ion binding 62 от 37 до 46 p<0.05

G0:0016779 nucleotidyltransferase activity 53 от 12 до 19 p<0.01

G0:0019843 rRNA binding 30 от 9 до 17 p<0.05

G0:0009987 cellular process 31 от 7 до 13 p<0.01

G0:0006888 ER to Golgi vesicle-mediated transport 6 от 9 до 10 p<0.05

G0:0097159 organic cyclic compound binding 19 от 6 до 10 p<0.01

G0:1901363 heterocyclic compound binding 19 от 5 до 10 p<0.01

G0:0006616 SRP-dependent cotranslational protein targeting to membrane 13 от 7 до 8 p<0.01

Таблица 3. Список генных онтологий, представленных среди генов Ь. niger значимо больше или меньше по сравнению с другими муравьями

(продолжение)

ID генной онтологии Генная онтология Число генов с данной генной онтологией у L. niger Число генов с данной генной онтологией у других муравьев p-значение Q-теста Диксона

G0:0006821 chloride transport 12 от 6 до 7 p<0.01

G0:0005779 integral component of peroxisomal membrane 1 от 4 до 6 p<0.05

G0:0046167 glycerol-3-phosphate metabolic process 7 от 4 до 5 p<0.05

G0:0009331 glycerol-3 -phosphate dehydrogenase complex 8 от 3 до 5 p<0.05

G0:0000439 core TFIIH complex 3 от 5 до 6 p<0.05

G0:0019239 deaminase activity 7 от 3 до 4 p<0.01

G0:1902361 mitochondrial pyruvate transport 1 от 4 до 5 p<0.01

G0:0043167 ion binding 23 от 1 до 9 p<0.05

G0:0000288 mRNA catabolic process 7 от 3 до 4 p<0.01

G0:0006779 porphyrin-containing compound biosynthetic process 6 от 3 до 4 p<0.05

G0:0004096 catalase activity 6 от 2 до 2 p<0.01

G0:0010906 glucose metabolic process 7 от 2 до 3 p<0.01

G0:0004360 glutamine-fructose-6-phosphate transaminase (isomerizing) activity 5 от 1 до 2 p<0.01

G0:0004749 ribose phosphate diphosphokinase activity 5 от 2 до 2 p<0.01

G0:0044238 primary metabolic process 78 от 1 до 13 p<0.01

G0:0043170 macromolecule metabolic process 75 от 0 до 13 p<0.01

G0:0009220 pyrimidine ribonucleotide biosynthetic process 4 от 0 до 1 p<0.01

G0:0046132 pyrimidine ribonucleoside biosynthetic process 4 от 0 до 1 p<0.01

G0:0006526 arginine biosynthetic process 6 от 0 до 2 p<0.01

Следует отметить значимое превышение числа белковых доменов с G0:0006281 "DNA repair", а также не значимое по Q-тесту Диксона, но заметное понижение числа доменов с онтологиями G0:0007218 "neuropeptide signaling pathway" и G0:0005549 "odorant binding".

3. Повторяющиеся элементы генома и белки ретровирусов и ретротранспозонов

По сравнению с другими муравьями, для которых проводился поиск повторяющихся элементов с помощью RepeatMasker, число повторяющихся элементов в геноме чёрного садового муравья меньше в 35 раз по процентному соотношению от общего размера генома (см. табл. 4). По суммарному размеру (3,47 миллионов пар оснований) повторяющихся элементов L. niger уступает C. floridanus в 2,5 раза (8.6 MB), а H. saltator — в 8,5 раз (30 MB). Это может быть связано с неполнотой сборки.

Также у L. niger не найдено SINE элементов и найдено гораздо меньше Tcl/mariner элементов. Тем не менее, LTR элементов найдено больше, чем у других муравьев и пчелы.

Таблица 4. Число повторяющихся элементов генома (в % от общего размера генома) у L. niger, C. floridanus, H. saltator, A. cephalotes и A. mellifera (с использованием данных Bonasio et al., 2010 и Suen et al., 2011).

L.niger C. floridanus H. saltator A. cephalotes A. mellifera

Повторы 5,56 15,05 26,86 25,51 6,86

SINEs 0 0,06 0,05 0,09 0,02

LINEs: 0,i8 0,64 0,65 0,45 0,17

LTR 1,19 0,47 0,88 0,68 0,16

Tci/mariner 0,04 0,4 4,42 4,5 0,33

Простые повторы 3,55 2,16 5,15 1,64 0,80

Длинные концевые повторы (LTR) фланкируют гены ретровирусов и ретротранспозонов. Помимо их большего количества в геноме L. niger, найдено гораздо больше ретровирусных генов gag и pol (475 генов pol или

gag-pol, у других муравьев от 4 до 55). При этом рядом с gag, pol не было найдено генов env, поэтому все данные гены предположительно принадлежат ретротранспозонам, а не ретровирусам.

4. Цитохромы P450

Число цитохромов P450 у 13 видов муравьев, а также A. mellifera и N. vitripennis указано в таблице 5.

Цитохромы P450 сильно дуплицированы у чёрного садового муравья. Всего обнаружено 72 гена (считая только те, чья кодирующая последовательность больше 250 аминокислот, см. табл. 5 и приложение, табл. 2) из 11 семейств цитохромов P450 в геноме L. niger и 15 случаев тандемных дупликаций цитохромов P450 (см. табл. 6). Большая часть из них относятся к цитохромам подсемейства CYP9E. Из-за относительно низкого качества сборки часть генов в подобных дупликациях представлена не полностью. Некоторые гены в дупликациях предполагаются нефункциональными, из-за небольшой длины продукта при наличии начала гена и стоп-кодона и отсутствии части белковых доменов CYP.

4.1. Семейство CYP9

Число генов семейства CYP9 у L. niger увеличено по сравнению с остальными муравьями, а также по сравнению с A. mellifera и N. vitripennis. Найдено 19 полных и 21 неполный, кодирующий больше половины продукта, генов. У остальных муравьев и A. mellifera число известных генов семейства CYP9 не превышает 25. Все CYP9 муравьев относятся к подсемейству CYP9E. N. vitripennis имеет 8 генов подсемейства CYP9E, а также 9 других генов других подсемейств девятого семейства цитохромов.

Дерево было построено (см. приложение, рис. 1) для 29 генов CYP9 L. niger, 10 генов C. floridanus, 9 генов S. invicta, 15 генов H. saltator, 16 генов A. echinatior, 3 генов A. cephalotes, 16 генов C. biroi, 3 генов A. mellifera, 6 генов N. vitripennis.

Таблица 5. Число предсказанных белковых последовательностей цитохромов P450 у исследуемых видов с учетом качества последовательности (подсчитаны только последовательности длиной больше 250 аминокислот, т.е. больше половины средней длины последовательности цитохрома P450)

Вид Семейство цитохромов p450 Всего

CYP4 CYP6 CYP9

L. niger 10 9 40 72

C. floridanus 24 20 13 75

H. saltator 11 18 16 61

A. echinatior 10 14 17 53

A. cephalotes 10 9 3 35

S. invicta 16 22 8 57

L. humile 14 23 - 54

P. barbatus 15 13 - 42

C. biroi 16 10 23 71

A. mellifera 5 15 5 38

N. vitripennis 31 29 17 93

M. faraonis 22 27 22 ?

C. obscurior 6 6 6 ?

V. emeryi 12 32 11 ?

W. auropunctata 22 26 25 ?

Гены СТР9 Ь. niger на дереве собраны в 10 кластеров, в шести из которых они располагаются вместе с генами С. floridanus, который относится к тому же подсемейству Formicmae (см. приложение, рис. 1).

Таблица 6. Тандемные дупликации цитохромов Р450 у Ь. niger.

Число

Семейство и генов в

подсемейство тандеме Гены

СУР6К 2 §9961, §9960

СУР9Б 2 §9153, §9152

СУР6Л 2 §7983, §7982

СУР9Б 4 §7628, §7627, §7626, §7625

СУР9Б 3 §6439, §6438, §6437

СУР9Б 2 §5510, §5509

СУР40 2 §4193, §4192

СУР9Б 2 §3384, §3383

СУР9Б 3 §10753, §10752, §10751

СУР9Б 2 §11396, §11395

СУР9Б 2 §11453, §11452

СУР9Б 2 §12549, §12549

СУР9Б 2 §14494, § 14493

СУР9Б 3 §16636, §16635, §16634

СУР9Б 2 §17521, §17520

По результатам 7-теста все СТР9 муравьев оказались под положительным отбором. Ни в одном случае не была отвергнута гипотеза о положительном отборе. На дерево цитохромов СТР9Е занесены статистически значимые результаты (р < 0,05) попарных сравнений, при которых гипотеза о нейтральной эволюции и очищающем отборе исключались.

Для поиска отбора по кодонам было построено выравнивание CYP9, включающее только полные кодирующие последовательности длиной от 1425 до 1800 нуклеотидов, имеющие старт- и стоп-кодоны. Для покодонного поиска отбора были взяты 3 кодирующие последовательности CYP9 A. cephalotes, 6 — A. echinatior, 4 — A. mellifera, 6 — C. biroi, 8 — C. floridanus, 11 — H. saltator, 19 — L. niger, — N. vitripennis, 5 — S. invicta, 8 — M. pharaonis, 5 — C. obscurior, 1 — V. emeryi, 3 — W. auropunctata.

Методом MEME обнаружено 59 позиции в выравнивании (см. приложение, табл. 3), на которые действовал эпизодический положительный отбор (статистически значимых при p-значении, меньшем 0,05). Остальные методы потвердили лишь три из них (FEL при p-значении, меньшем 0,05; FUBAR при апостериорной вероятности, большей 0,95). Также найдено 469 сайтов под очищающим отбором (статистически значимы для хотя бы одного из трех методов: SLAC, FEL -при p-значении, меньшем 0,05, FUBAR - при апостериорной вероятности, большей 0,95).

Одиннадцать из позиций, находящихся под положительным отбором, расположены в лиганд-связывающем кармане фермента. Ещё четыре расположены на C-конце, однако эта часть выравнивания присутствует не во всех последовательностях, соответственно, этот результат показан для меньшей выборки. Большинство из сайтов, находящихся под очищающим отбором, лежат в структурных доменах белка. Во многих сайтах, где MEME обнаружил следы положительного отбора, FUBAR выявил очищающий. Это связано с тем, что MEME способен определять следы эпизодического положительного отбора, то есть те случаи, когда позиция является консервативной в большинстве линий, но в некоторых на неё действует диверсифицирующий отбор.

Из таблицы 7 видно, что наиболее частые несинонимичные замены в семействе СТР9 происходили без изменения заряда и полярности остатка (Валин на изолейцин, аспартат на глутамат, изолейцин на лейцин, лизин на аргинин, серин на треонин, валин на аланин), однако также существенную долю замен составляют замены лизина на глутамат, аспарагина на аспартат, аланина на треонин и изолейцина и лейцина на метионин. Наиболее редки замены цистеина и триптофана.

Таблица 7. Число замен одного аминокислотного остатка на другой для выравнивания семейства СТР9, использованного для покодоного поиска отбора. Зеленым выделены наиболее частые замены.

Leu 11е Met Va1 Ser Рго ты- А1а Туг His G1n Asn Lys Asp G1u Тгр Ащ G1y

Phe 373 153 46 94 51 5 13 13 166 7 5 1 3 23 8 5 3

Leu 362 263 283 70 59 36 35 14 26 40 4 15 9 8 10 28 35 6

11е 227 595 23 7 178 44 8 5 4 36 35 5 5 5 16 10

Met 115 10 9 100 22 2 1 6 9 35 1 15 2 12 2

Val 31 13 90 276 17 4 5 13 12 23 57 4 1 6 44

Ser 112 300 192 28 7 6 186 38 23 15 50 3 48 109

Pro 41 90 3 13 23 5 13 4 18 1 39 9

Thr 279 8 7 4 127 91 20 17 3 5 32 21

Ala 3 3 5 10 18 43 71 9 1 10 144

Tyr 98 3 39 5 18 3 37 3 7 2

His 73 81 7 37 8 5 56 2

Gln 17 119 9 95 2 82 2

Asn 225 286 28 5 1 28 39

Lys 36 280 1 1 325 27

Asp 415 3 9 103

Glu 1 1 25 58

2 15 12

Trp 9 4

Ащ 44

4.2. Семейство CYP9 Lasius flavus

При выравнивании двух геномов садовых муравьев (Ь. niger и Ь. Аоуш) в регионах, где располагаются недавние дупликации СТР9, у Ь. Аоуш почти во всех случаях один из недавно дуплицированных генов полностью или частично отсутствует (см. приложение, рис. 2). Ортолог §3383 Ь. Аауш присутствует полностью, а продукт его дупликации, g3384 отсутствует, в сборке по референсу отсутствует покрытие в первой половине гена. Присутствуют гены g6437 и g6438, но отсутствует покрытие в регионе гена g6439. Аналогично есть покрытие в генах g7626 и §7627, но присутствует лишь частично в g7625 и почти полностью отсутствует в g7628. Ортологи g9152 и g9153 присутствуют оба, по крайней мере, если судить по сборке по референсу. Ортологи g11396 и g10753 присутствуют полностью, однако у их паралогов g10752 и g11395 нет покрытия чтениями примерно для половины гена.

4.3. Семейство CYP4

Число генов четвертого семейства цитохромов Р450 Ь. niger не превышает числа соответствующих генов у остальных муравьев. Почти все остальные муравьи обладают набором из 10-16 последовательностей СТР, кодирующих больше половины продукта. С. floridanus, М. рИатотз и Ж. аторшс1а1а обладают большим числом СТР4, чем другие муравьи. У А. те1^ет и N. уНпрептз есть соответственно 5 и 32 предсказанных генов СТР4.

Наиболее сильно дуплицированные у муравьев гены предположительно относятся к подсемейству СТР4С, как наиболее близкие к гену А. те1^ет сур4с1.

Две дупликации Ь. niger на филогенетическом дереве располагаются вместе с кластерами генов С. floridanus (см. приложение, рис. 3). Остальные гены Ь. niger на дереве располагаются поодиночке, чаще

вместе с генами C. floridanus. Все исследуемые виды имеют свои специфичные дупликации или амплификации CYP4 за исключением

C. obscurior.

Среди муравьев между генами цитохромов P450 четвёртого семейства был найден положительный отбор во всех ветвях дерева, кроме ортологов одного из генов CYP4C1 N. vitripennis, принадлежащих C. floridanus, M. pharaonis, V. emeryi и W. auropunctata. Также отбор не был статистически значимым для некоторых недавних дупликаций генов внутри одного вида (C. floridanus, C. biroi, V. emeryi, L. humile).

4.4. Cемейство CYP6

У L. niger найдено 30 фрагментов генов, близких к CYP6 других видов, однако лишь 9 из них кодируют больше половины длины продукта, и только 5 имеют стабилизирующую железо гема последовательность. У других исследуемых видов найдено от 12 до 133 фрагментов генов семейства CYP6 (кодирующая последовательность длиной более 750 нуклеотидов у 6-32 из них). Среди муравьев наибольшее число CYP6 имеют инвазивные виды M. pharaonis, V. emeryi, L. humile, W. auropunctata, S. invicta (более двадцати генов CYP6 у каждого, однако у половины из них отсутствует либо нарушена стабилизирующая гем последовательность), а наименьшее - C. biroi.

На дереве (приложение, рис. 4) видно, что у всех видов муравьев, за исключением L. niger и A. cephalotes, происходили специфичные дупликации, в большей степени у C. floridanus и S. invicta - у двух этих видов есть 4 специфические группы генов по 3-4 гена в каждой и одиночно располагающиеся на дереве гены.

Как и для двух предыдущих двух семейств, положительный отбор не был статистически значимым только для относительно недавних дупликаций (большинство из них принадлежат C. floridanus).

5. Результаты молекулярного докинга и виртуального скрининга

Всего было построено 23 модели СТР9 муравьев, из которых 10 — для белков Ь. niger. По результатам молекулярного докинга 188 соединений были отобраны комплексы белок-лиганд со значением свободной энергии, меньшим -100 ккал/моль, для которых лиганд попал в активный центр фермента, находящийся выше плоскости гема. Всего таких комплексов оказалось 226, из них 70 — для цитохромов р450 Ь. niger. Для трёх моделей белков ^5510, g9153 Ь. niger, БШ77009.1/И8ЛЬ11619-КЛ Н. saltator) энергетически выгодных комплексов с выбранными соединениями обнаружено не было, в дальнейший анализ они включены не были.

Результаты виртуального скрининга представлены в таблице 8. Среди лигандов, образующих комплексы с цитохромами р450 девятого семейства муравьев, оказались углеводы (рафиноза, сахароза, изомальтотриоза), микотоксины (веррукулоген, охратоксины А и В, роридин А, фузарин С, фумонизин В1, цитохалазины а, Ь и d, энниатин В, Т-2 токсин, НТ-2 токсин), фитотоксины (аконитин, вератридин, олеандрин, птакилозид, церберин), инсектициды (циперметрин, перметрин, азадирахтин), стероиды и их производные (20-гидроксиэкдизон, экдизон, гликохолиевая кислота, таурохолиевая кислота).

Для 10 и более моделей СТР9 муравьев из 20 энергетически выгодными оказались комплексы с рафинозой, фумонизином В1, азадирахтином, Т-2 токсином, амигдалином, фузарином С и вератридином. Комплексы с минимальным значением свободной энергии в качестве лиганда содержали фумонизин В1, азадирахтин, вератридин, аконитин и рафинозу.

муравьев.

Лиганд Его описание Число энергетически выгодных комплексов СУР9 муравьев с данным соединением (из 20) Среднее значение свободной энергии комплексов Число энергетически выгодных комплексов СУР9 Ь. niger с данным соединением (из 8) Среднее значение свободной энергии комплексов СУР9 Ь. niger

20-Гидроксиэкдизон Гормон, стероид 8 -113,29 2 -112,85

Азадирахтин Инсектицид растительного происхождения 12 -135,61 4 -142,93

Аконитин Фитотоксин, Алкалоид, терпеноид 9 -133,18 3 -136,87

Амигдалин Фитотоксин, гликозид 11 -123,95 2 -125,90

Вератридин Фитотоксин, алкалоид, стероид 10 -128,92 4 -135,03

Веррукулоген Микотоксин 5 -111,90 2 -121,00

Гликохолиевая кислота Стероид 8 -112,36 3 -110,00

Декстран (Изомальтотриоза) Углевод, трисахарид 5 -111,68 1 -105,60

Олеандрин Фитотоксин, гликозид 9 -116,99 2 -114,20

Охратоксин А Микотоксин, производное кумарина 2 -116,60 0 -

Охратоксин В Микотоксин, производное кумарина 3 -121,40 1 -143,20

Перметрин Пиретроидный инсектицид 1 -121,40 0 -

Птакилозид Фитотоксин, терпеноид, гликозид 1 -125,50 1 -125,50

Рафиноза Углевод, трисахарид 15 -128,83 5 -138,02

Роридин А Микотоксин, терпеноид 6 -115,03 2 -111,50

Сахароза Углевод, дисахарид 3 -118,23 3 -118,23

муравьев (продолжение).

Лиганд Его описание Число энергетически выгодных комплексов СУР9 муравьев с данным соединением (из 20) Среднее значение свободной энергии комплексов Число энергетически выгодных комплексов СУР9 Ь. niger с данным соединением (из 8) Среднее значение свободной энергии комплексов СУР9 Ь. niger

Сирингин Растительный метаболит, гликозид 4 -116,08 2 -117,15

Таурохолиевая кислота Стероид 4 -118,20 1 -117,50

Фузарин С Микотоксин 10 -116,47 3 -119,37

Фумонизин В1 Микотоксин 13 -155,52 5 -154,06

Церберин Фитотоксин, стероид, гликозид 6 -120,92 2 -116,55

Циперметрин Пиретроидный инсектицид 2 -117,20 1 -113,80

Цитохалазин а Микотоксин, алкалоид 1 -123,50 0 -

Цитохалазин Ь Микотоксин, алкалоид 6 -112,05 2 -112,85

Цитохалазин d Микотоксин, алкалоид 8 -111,91 3 -113,87

Экдизон Стероид, прогормон 8 -111,74 2 -111,65

Энниатин В Микотоксин 7 -119,10 1 -124,80

Эрготамин тартрат Микотоксин, алкалоид 7 -117,50 2 -123,00

НТ-2 токсин Микотоксин, трихотецены 4 -109,73 1 -110,60

Т-2 токсин Микотоксин, трихотецены 11 -115,24 3 -114,13

Цитохромы р450 девятого семейства Ь. niger вступают в комплексы с азадирахтином и рафинозой со значимо большим по модулю значением свободной энергии по сравнению с исследованными белками того же семейства других муравьев (по и-критерию Манна-Уитни).

По онтологиям ChEBI среди лигандов, вступающих в комплексы с СТР9 муравьев, значимо меньше (точный тест Фишера) по сравнению со всеми возможными комплексами белок-лиганд инсектицидов и поллютантов, но значимо больше фито- и микотоксинов (см. табл. 9). Также значимо меньше среди лигандов в энергетически выгодных комплексах по сравнению с ожидаемым (то есть по сравнению с той ситуацией, когда все возможные комплексы являются энергетически выгодными, а лиганд располагается в активном центре фермента) хлор- и фосфорорганических соединений и жирных кислот, но при этом больше гликозидов, углеводов (в частности трисахаридов), стероидов и их производных, триолов, индолов, лактамов и терпеноидов (в частности трихотеценов). При этом у СТР9 Ь. niger различия в представленности онтологии инсектицидов и трихотеценов не значимы (из-за поправки на множественные сравнения).

Также с помощью iGemdock были определены аминокислотные остатки, вызывающие наибольшее понижение энергии для некоторых из полученных моделей белков (см. табл. 10). Они были сопоставлены с выравниванием СТР9 муравьев. Оказалось, что 143, 241 и 405 позиции в выравнивании, находящиеся под положительным отбором, также обеспечивают понижение свободной энергии почти для всех изученных белков СТР9, то есть участвуют в связывании лиганда.

Таблица 9. Отличия по представленности онтологий ChEBI среди лигандов, вступающих в энергетически выгодные комплексы с СТР9, по сравнению с представленностью онтологий во всех потенциально возможных комплексах (по результатам точного теста Фишера).

Онтология СЬБВ1 Более или менее представлена по сравнению с ожидаемым р-значение (все комплексы) р-значение (только комплексы с СУР9 Ь. niger)

Хлорорганическое соединение меньше 0,028 >0,05

Терпеноиды и их производные больше 0,000 0,006

Гликозид больше 0,000 0,000

Углевод больше 0,000 0,000

Жирная кислота меньше 0,000 0,021

Стероиды и их производные больше 0,000 0,019

Индол больше 0,008 >0,05

Лактам больше 0,000 >0,05

Трихотецен больше 0,004 >0,05

Фосфорорганические соединения меньше 0,029 >0,05

Триол больше 0,000 >0,05

Трисахарид больше 0,000 0,000

Инсектицид меньше 0,000 >0,05

Фосфорорганические инсектициды меньше 0,029 >0,05

Поллютант меньше 0,000 0,005

Фитотоксин больше 0,000 0,026

Микотоксин больше 0,000 0,000

Таблица 10. Аминокислотные остатки, обеспечивающие понижение свободной энергии (выделены жёлтым). Красным отмечены соответствующие позиции в выравнивании, находящиеся под положительным отбором согласно MEME.

Позиция в выравнивании 7 2 6 7 ад 8 2 6 7 ад HSAL23634-RA HSAL18954-RA g10753 CFLO11633-RA EGI69994.1 g11948 HSAL18957-RA 9 4 5 2 ад CFLO11366-RA 2 5 7 0 ад SINV20322-RA

126 Arg Arg Arg ^ His His His His Arg ^ His Arg His

129 Phe Phe Ser Phс Lсu Phс Phс Phe Sсr Lсu Phс Мй №с

130 - - Пс Val Val Val Val Gly Val Val 11с 11с Va1

134 Asn Asn Gln Gln Gln Asn Asn Asn Gln Gln G1n G1n G1n

136 Pro Pro Pro Pro Pro Pro Pro Pro Pro РГО Рго Рго Lys

142 Leu Leu Lсu Leu Lсu Lсu Lсu Lсu Lсu Leu Lсu Lсu Lсu

143 Phe Phe Phe Phс Phс Phс Phс Lсu Phс Phс Phс Phс Va1

234 Tyr Tyr Thr Tyr Tyr Tyr Tyr Cys Phс Туг Туг Туг Туг

241 Ser Ser Val Thr Thr Asn Thr Asn Phс Thr Asn Asn Asn

242 Phe Phe Val Phс Phe Phс Phс Phс Val Р^ Phс Phс Phс

334 Пв Ile Sсr Ser Val Lсu 11с Val ЛЬ Val 11с Lсu 11с

335 Phe Phe Phс Phс Phс Phс Phс Phe Phс Phс Phс Phс Phс

337 Phe Phe Phс Phс Lсu Lсu Phe Lсu Lсu Lсu Phс Р^ Phс

338 ^у Gly Ala Gly Ala ^у Gly Gly Ala Ala ^у G1y G1y

339 Gly Gly Gly Gly Gly Gly Gly Gly Gly ^у G1y G1y G1y

341 Asn Asn Glu Asn Asn Asn Asn Asn Asn Asn Asn Asn G1u

342 Thr Thr Ser Sсr Sсr Ala Thr Sсr Thr Sсr Sсr Sсr Ser

404 Pro Pro Pro Pro Pro Pro Pro Pro РГО Рго Рго Рго Рго

405 Pro Pro Lсu Val Val Val ИС Ala Рго Val 11с 11с Va1

406 - - - - - - - - - - Asn - -

Таблица 10. Аминокислотные остатки, обеспечивающие понижение свободной энергии (выделены жёлтым). Красным отмечены соответствующие позиции в выравнивании, находящиеся под положительным отбором согласно MEME (продолжение).

Позиция в выравнивании 7 2 ЧО 7 ад 8 2 ЧО 7 ад ИБАЬ23634-ЯА ИБАЬ18954-КА В10753 СРЬ011633-КА Б0169994.1 е11948 ИБАЬ18957-КА 9 4 5 2 ад СРЬ011366-ИА 2 5 7 0 ад БШУ20322-ИА

407 Уа1 Уа1 ТЬг А1а А1а - А1а 01и РЬе А1а А1а А1а А1а

408 А1а А1а А1а Уа1 А1а Рго А1а Ьеи Уа1 А1а Рго Рго Бег

409 РЬе РЬе Ьеи А1а А1а РЬе РЬе Мег Ьеи А1а А1а РЬе А1а

410 Ьеи Ьеи 11е Уа1 Мег 01и Ьеи ТЬг 11е Мег Ьеи Ьеи Мег

439 Тгр Тгр Ьеи Тгр Тгр Тгр Тгр Тгр Ьеи Тгр Тгр Тгр Тгр

485 А^ А^ Ьу8 А^ А^ А^ А^ А^ Аге А^ А^ А^ А^

529 Ьеи Ьеи 11е РЬе РЬе РЬе РЬе РЬе Уа1 РЬе РЬе РЬе РЬе

530 Уа1 11е РЬе ТЬг А8И А1а А1а Бег 11е Бег А8И А8И ТЬг

531 Мег Мег Ьеи Мег Уа1 Мег Мег Мег Ьеи Мег Уа1 Мег Ьеи

6. Глутатион-8-трансферазы

Было обнаружено 15 генов глутатион-Б-трансфераз Ь. niger и установлено их соответствие с ортологами С. floridanus (см. табл. 11). Поскольку сильной амплификации либо потерь генов данной системы детоксикации не было обнаружено (при этом не все гены глутатион-Б-трансфераз Ь. niger были полными), дальнейший анализ последовательностей для данного генного семейства не проводился.

Таблица 11. Глутатион трансферазы L. niger и их ортологи у C. floridanus (*для генов L. niger указаны ID в GenBank и ID в аннотации Augustus для тех, которые были на химерных контигах с бактериями и не были поданы в GenBank).

Lasius niger Camponotus floridanus

gl6243* -

g4928* XP_011262918.1

g29590* XP_011260834.1 (EFN65387.1)

g21474* XP_011260793.1

KMQ84643.1 XP_011260793.1

KMR04753.1 XP_011266593.1

g31700* XP_011260834.1 (EFN65387.1)

g9089* XP_011262918.1

g33264* XP_011262918.1

KMQ97936.1 XP_011260834.1 (EFN65387.1)

g8490* XP_011266593.1

KMQ89185.1 XP_011260793.1

KMQ97840.1 XP_011255352.1

KMQ89038.1 XP_011265519.1

KMQ89039.1 XP_011265525.1 (EFN62035.1)

7. Обонятельные рецепторы и одорант-связывающие белки

С помощью программ BLASTP, HMMER, TBLASTX и BLAST2GO среди предсказанных белковых последовательностей Ь. niger было обнаружено 75 предположительных обонятельных рецептора и 3 одорант-связывающих белка (имеется еще один кандидат в одорант-связывающие белки, сходный с последовательностями OBP муравьев, но неполный, длиной в 74 аминокислотных остатка и не распознающийся как OBP программой BLASTP по базе данных refseq_protein). Лишь 26 из 75 фрагментов генов обонятельных рецепторов имели известную кодирующую последовательность, длиной больше 750 нуклеотидных остатков, и были включены в филогенетический анализ и поиск следов

отбора. Филогенетическое дерево обонятельных рецепторов служило для облегчения поиска отбора и поиска ортологов и не приводится из-за своей громоздкости.

Таблица 12. Число генов и фрагментов генов муравьев и A. meПifera, близких к обонятельным рецепторам и одорант-связывающим белкам.

Вид Количество предсказанных генов обонятельных рецепторов Из них длиной более половины кодирующего региона Количество предсказанных генов одорант-связывающих белков

L. niger 74 31 3

C. floridanus 225 49 7

A.echinatior 118 62 9

A. cephalotes 269 142 12

S. invicta 193 106 16

P. barbatus 273 102 13

H. saltator 157 87 11

L. ЫшШ 156 85 12

C. Ы^ 474 335 18

M. pharaonis 325 230 17

V. emeryi 424 334 20

W. auropunctata 391 203 19

C. obscuritor 155 81 12

A. meПifera 127 86 21

Число фрагментов генов обонятельных рецепторов остальных муравьев варьирует от 118 до 474, из них для филогенетического анализа были отобраны от 49 до 335. Для A. meПifera найдено 127 обонятельных рецепторов, из них 86 были использованы для поиска отбора (см. табл. 12).

У Ь. niger по отношению с другими муравьями (см. табл. 12) меньше всего одорант-связывающих белков: всего 3 по сравнению с 7 у C. floridanus и от 9 у A. echinatior до 19 у V. emeryi. У A. mellifera 21 ОВР. Построение филогенетического дерева и поиск отбора для данного семейства не производились.

Среди генов обонятельных рецепторов Ь. niger было найдено 5 тандемных повторов: 3 дупликации и 2 тандемных амплификации по 5 генов. В таблице 13 приведено сравнение данных амплификаций с таковыми у других видов (указаны только тандемные дупликации). Ни одна из дупликаций Ь. niger не была для него специфичной, соответствующие тандемные дупликации присутствуют хотя бы у одного из других рассмотренных видов.

7-тест обнаружил следы положительного отбора для всех ближайших соседей по филогенетическому дереву. Таким образом, большинство генов обонятельных рецепторов Ь. niger находятся под отбором, несмотря на уменьшение их числа.

В отличие от филогенетических деревьев семейств CYP гены обонятельных рецепторов Ь. niger не всегда формируют кластеры с C. floridanus, равно как и гены двух довольно близких видов муравьев-листорезов. Таким образом, каждый изученный на геномном уровне вид муравьев обладает собственным набором обонятельных рецепторов, претерпевшим специфические дупликации и псевдогенизации.

Таблица 13. Тандемные дупликации обонятельных рецепторов L. niger и соответствующие им дупликации у других видов (для других видов приведены идентификационные номера в базах данных NCBI или antgenomes.org).

Номера тандемных кластеров Ь. niger С.Аопёапш Н^аЬаО A.cephalotes А.теШ/ега

1 g6705 БШ67337 ББШ8619 БШ78625 БШ78623 БШ78622 №_001229897 №_001229898

g6703 БШ67339 БШ67340 ЕБШ8624 ББШ8628 БШ78627 №_001229896 №_001229899

2 g3631 БШ67333

g3633 00003036-ЯЛ

g3634 БШ67332 БЕЧ78909 00003037-ЯЛ

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.