Организация генов, кодирующих белки семейства SMC у обыкновенной полевки Microtus arvalis: Arvicolinae, Rodentia тема диссертации и автореферата по ВАК РФ 03.00.15, кандидат биологических наук Павлова, Софья Викторовна
- Специальность ВАК РФ03.00.15
- Количество страниц 113
Оглавление диссертации кандидат биологических наук Павлова, Софья Викторовна
Глава 1. Обзор литературы
1.1. Введение
1.2. Организация интерфазного хроматина в ядре
1.3. Структура метафазных хромосом
1.4. Структурные белки семейства SMC
1.5. Молекулярная структура белков SMC семейства
1.6. Организация генов, кодирующих белки семейства SMC
1.7. Сегрегация бактериальных хромосом. Особенности прокариотических 24 представителей семейства SMC
1.8. Когезия сестринских хроматид
1.8.1. Сцепление сестринских хроматид происходит при участии комплекса 27 когезин, коровым компонентом которого являются белки SMC1-SMC
1.8.2. Биохимические свойства и архитектура комплекса когезин
1.8.3. Инициация сцепления сестринких хроматид
1.8.4. Распределение комплексов когезин на хромосомах
1.8.5. Разделение хроматид в митозе
1.8.6. 4 Когезия сестринских хроматид в мейозе
1.9. Белки SMC участвуют в процессах рекомбинации
1.10. Участие белков SMC5-SMC6 в рекомбинационной репарации 37 двуцепочечных разрывов ДНК
1.11. Формирование митотических хромосом при участии гетеродимера 38 SMC2-SMC4 в составе комплекса конденсин
1.11.1. Регуляция локализации конденсина в клеточном цикле
1.11.2. Взаимодействие конденсина с хроматином
1.11.3." Гетеродимер SMC2-SMC4 дрожжей S.pombe способен ренатурировать i днк
1.11.4. Конденсин вводит положительные супервитки в замкнутую молекулу 42 ДНК in vitro, используя энергию гидролиза АТФ
1.11.5. Конденсин-подобный комплекс у C.elegans отвечает за дозовую 44 4 компенсацию генов
1.12. Модель инактивации X хромосомы у самок высших млекопитающих 44 при участии SMC содержащих комплексов
1.13. Перспективы изучения механизма инактивации Х-хромосом на модели 46 межвидовых гибридов обыкновенных полевок (род Microtus, группа arvalis") •
Введение диссертации (часть автореферата) на тему «Организация генов, кодирующих белки семейства SMC у обыкновенной полевки Microtus arvalis: Arvicolinae, Rodentia»
Актуальность проблемы
Структурные белки хроматина семейства SMC (Structural Maintenance of Chromosomes) играют важную роль во многих процессах, связанных с метаболизмом ДНК в клетке. Это, консервативное у всех организмов семейство белков, содержит пять эукариотических групп и одну бактериальную. Представители SMC семейства эукариот входят в состав биохимических комплексов, отвечающих за когезию сестринских хроматид, рекомбинацию, репарацию, регуляцию экспрессии генов (SMC1/SMC3, SMC2/SMC4, SMC5/SMC6), формирование митотических хромосом (SMC2/SMC4) (Strunnikov & Jessberger, 1999; Hirano, 1999; Jessberger et al., 1998). Анализ литературных данных показывает, что белки SMC являются базовым компонентом ряда систем наследования, изменчивости и реализации генетического материала клеток.
Ранее нами было высказано предположение, что SMC белки могут участвовать в поддержании дозовой компенсации X хромосом у самок млекопитающих (Павлова и др. 2000). Генетическая система этих белков, однако, слабо изучена. Выявление генов семейства SMC в геноме обыкновенных полевок и анализ их функций является первоочередной задачей, стоящей на пути исследования участия белков SMC в процессе дозовой компенсации Х-хромосом у самок высших млекопитающих в целом, и изучения феномена неслучайной инактивации у обыкновенных полевок в частности (Zakian et al., 1987).
Цель и задачи исследования
Целью настоящей работы является изучение последовательностей ДНК генома обыкновенной полевки Microtus arvalis, кодирующих белки семейства SMC. В конкретные задачи работы входило:
1. Выявить и установить последовательность гена Masmc4 (Microtus arvalis подсемейства SMC4) в геноме полевки М.arvalis
2. Выявить и установить последовательность мРНК генаMasmc4 группы.
3. Определить экзон-интронную структуру тгъг.Машс4
4. Проанализировать промоторную область гена Masmc4
5. Определить локализацию гена Masmc4 на хромосомах обыкновенных полевок
6. Выявить и проанализировать методом ПЦР последовательности ДНК, кодирующие белки SMC1, SMC2, SMC3 в геноме полевки.
7. Проанализировать полученные данные в свете сравнительной геномики
Научная новизна и практическая ценность работы
В нашей работе мы впервые выявили гены структурных белков SMC в геноме обыкновенной полевки M.arvalis и выделили полную копию гена Masmc4 (Microtus arvalis подсемейства SMC4), установили его экзон/интронную структуру, провели анализ 5' регуляторной области. Выявили последовательности 3' районов генов Masmcl, Masmc2, Masmc3 обыкновенной полевки и показали высокую степень их гомологии с известными последовательностями белков SMC.
Проведен сравнительный анализ генов белков семейства SMC4 грызунов (M.arvalis, Mus musculus, Rattus norvegicus), человека, шпорцевой лягушки (Xenopus laevis) и выявлены основные принципы организации и регуляции исследуемых генов.
Последовательности ДНК генов зарегистрированны в базе данных EMBL. Наши данные подтвердили высокую степень гомологии последовательностей белков SMC у разных групп организмов. Они являются несомненным вкладом в изучение генетики семейства структурных белков SMC.
Апробация работы и публикации
По материалам диссертации опубликованы две работы. Результаты работы были доложены на двух международных конференциях.
Структура и объем диссертации
Диссертация состоит из введения, обзора литературы, материалов и методов, результатов и обсуждения, заключения, выводов и списка цитируемой литературы.
Заключение диссертации по теме «Генетика», Павлова, Софья Викторовна
Определена полная нуклеотидная последовательность гена MaSMC4 полевки M.arvalis размером 32000 п.о. Ген Masmc4 обыкновенной полевки состоит из 24 экзонов, рамка считывания начинается экзоне №2. Размер мРНК составляет 4218 п.н., размер кодируемого белка составляет 1286 а.о. t
Область 5' гена MaSMC4 содержит CpG островок размером 1750 п.о., простирающийся в район экзона-интрона №1, экзона №2. Показано, что область CpG островка гена MaSMC4 имеет отрицательный потенциал связывания нуклеосом. Регуляторная область гена SMC4 у мыши, крысы, полевки и человека перекрывается с потенциальным геном, гомологичным ВС034101 (H.sapiens) и имеет размер около 500 п.о. Гены SMC4 имеют множестванные точки старта транскрипции. В области мажорной точки старта располагается элемент INR CCA+iTTTT (PyPyA+iNT/ApyPy). Для 5' области гена SMC4 характерно отсутствие ТАТА-бокса и наличие множественных потенциальных сайтов связывания базального транскрипционного фактора Spl. INR(+), ТАТА(-) класс промоторов является характерным для генов домашнего хозяйства с конститутивным уровнем экспрессии.
Проанализирована степень дивергенции кодирующих последовательностей гена SMC4 полевки, мыши, крысы, человека и шпорцевой лягушки. Среднее отношение коэффициента синонимичных на коэффициент несинонимичных замен (Ka/Ks) исследованных генов SMC4 составляет 0,123. Наиболее вариабельным районом гена является экзон №2 (Ka/Ks=0,71), экзоны №3-24 подвержены более сильному давлению стабилизирующего отбора (Ka/Ks=0,l 11). Наиболее консервативным районом генов SMC4 является участок, кодирующий С-глобулярный домен белков, содержащий ДА-бокс (Ka/Ks=0,024).
Определены последовательности ДНК полевки M.arvalis, кодирующие белки семейства SMC1, SMC2 и SMC3. Показана высокая гомология данных пептидов с районами ДА-бокс белков SMC1, SMC2 и SMC3 человека, мыши, шпорцевой лягушки.
Целью настоящей работы являлось описание генов семейства SMC в геноме обыкновенной полевки M.arvalis. Используя современные данные и подходы мы проанализировали структуру генов семейства SMC у человека, мыши и крысы и сравнили с собственными экспериментальными данными.
Методом ПЦР были амплифицированы районы генов SMC 1,2,3, кодирующие консервативный домен Да-бокс. Методом «прогулки по хромосоме» были выявлены ряд перекрывающихся геномных фаговых клонов полевки M.arvalis, содержащих последовательность гена белка SMC4, обозначенного нами как MaSMC4 (vSMC4). Методом радиоактивного скрининга кДНК библиотеки полевки M.arvalis и ПЦР со специфическими праймерами (с последующим сиквенсом полученных фрагментов ДНК), мы выявили последовательность мРНК гена MaSMC4. При сравнении последовательностей гена и мРНК MaSMC4 мы определили экзон-интронную структуру. Размер гена составляет 32 т.п.о., ген состоит из 24 экзонов и интронов, содержит CpG островок длиной 1750 п.о. в 5'-области гена (включая район экзона №1 и №2), рамка считывания белка SMC4 начинается в экзоне №2. Последовательность гена MaSMC4 высоко гомологична генам SMC4 мыши, крысы, человека и шпорцевой лягушки. В последнем случае процент дивергенции нуклеотидных последовательностей мРНК составляет 28% (белков - 24,8%). Наиболее близким гену SMC4 полевки по структуре оказался ген SMC4 мыши, степень дивергенции мРНК составила 8,8%, белков - 7,5%. Среднее отношение коэффициента синонимичных к коэффициенту несинонимичных замен (Ka/Ks) в мРНК генов SMC4 полевки, мыши, крысы, человека и шпорцевой лягушки составляет 0,123. Наиболее вариабельным районом гена является экзон №2 (Ka/Ks=0,71), экзоны №3-24 подвержены сильному давлению стабилизирующего отбора (Ka/Ks=0,lll). Наиболее консервативным районом генов SMC4 является участок, кодирующий С-глобулярный домен белков, содержащий ДА-бокс (Ka/Ks=0,024).
Современные данные, полученные при анализе последовательности геномов мыши и человека, свидетельствуют, что степень дивергенции кодирующих областей генов является низкой, что позволяет выявлять ортологичные гены, а степень дивергенции регуляторных последовательностей является достаточно высокой, чтобы выявлять присутствующие там функциональные элементы. Промоторная область генов SMC4 у видов полевка, мышь, крыса, лягушка содержит консервативные участки, которые могут являться значимыми для регуляции экспрессии данного гена.
Регуляторная область гена SMC4 у мыши, крысы, полевки и человека перекрывается с потенциальным геном, гомологичным ВС034101 (H.sapiens) и имеет размер около 500 п.о. Гены SMC4 имеют множестванные точки старта транскрипции. В области мажорной точки старта располагается элемент INR CCA+iTTTT (PyPyA+iNT/ApyPy). Для 5' области гена SMC4 характерно отсутствие ТАТА-бокса и наличие множественных потенциальных сайтов связывания базального транскрипционного фактора Spl. INR(+), ТАТА(-) класс промоторов является характерным для генов домашнего хозяйства с конститутивным уровнем экспрессии. Основной функцией факторов Spl, возможно, является поддержание ДНК промоторного районов активных генов в неметилированном состоянии и «открытой» конформации. Отсутствие метилирования цитозинов спобствует сохранению островков CpG в 5'области генов, тогда как при дезаминировании метилированных цитозинов в ДНК происходит замена на тимин и «размывание» кластеров CpG в нейтральных позициях генома.
ДНК CpG островков генов SMC4 исследуемых видов в промоторной области и районе первых двух экзонов имеет отрицательный потенциал связывания нуклеосом, что косвенно свидетельствует о высоком уровне транскрипции. Высокая консервативность, низкие значения Ka/Ks, отражающие действие стабилизирующего отбора, потенциально «активная» 5'область, содержащая островок CpG является следствием высокой биологической значимости белков семейства SMC4.
Район синтении, содержащий ген SMC4 охватывает порядка 20 м.п.н. на 3 хромосоме у человека (3q25 бэнде, в районе 150 м.п.н.), 18 м.п.н. на 3 хромосоме у мыши (ЗЕ2 цитологический бэнд 69 м.п.н.) и 22 м.п.н. на 2 хромосоме у крысы (2q31 бэнд 150.8 м.п.н.). Порядок генов в синтенных группах, содержащих ген белка SMC4 (от гена TM4SF1 до гена SERFINI), у трех видов сохранен. Около 90% геномов мыши и человека организованы в консервативные синтенные группы, сохраняющие порядок генов, который имел место у предкового организма (MGSC, 2002).
Семейство SMC эукариот включает в себя шесть основных генов SMCl-б, играющих значительную роль в реорганизации структуры хроматина в клеточном цикле и регуляции транскрипционной активности. Наиболее консервативными внутри семейства являются гены SMCla и SMC3. Процент дивергенции аминокислотных последовательностей варьирует от 0.1% между белками SMC3 мыши и человека до 2% между белками SMCla мыши и крысы. Высокая степень консервативности генов SMCla и SMC3 отражает большое функциональное значение данных генов для клетки. Помимо участия в когезии хроматид в митозе и мейозе, продукты генов SMCla и SMC3 входят в состав кинетохорной пластинки и аппарата веретена деления. Кроме этого, белок SMC3 был описан ранее как продукт гена Ъатасап (Cspg6), который выполняет функцию, совершенно не связанную с реорганизацией ДНК — в форме протеогликана присутствует во внеклеточных образованиях соединительных тканей.
У млекопитающих присутствует дополнительный ген SMClfi, отвечающий за когезию центромер в мейозе и возникший, по-видимому, в результате дупликации гена SMCla. Гены SMClfi и SMCla выравниваются между собой по всей длине и процент гомологии на нуклеотидном уровне составляет 61%. Отношение коэффициентов синонимичных и несинонимичных замен для данной пары генов составляет у мыши 0,144 и у человека 0,129. Данные показатели Ka/Ks характерны для консервативных генов, поддерживаемых стабилизирующим отбором. В данном случае, это свидетельствует о наличии функциональных участков, общих для генов SMC1J2 и SMCla, а фиксация незначительной части замен приводит к возникновению обособленной функции у гена SMClfi.
Другой пример, когда в геноме возникает дополнительный ген SMC, известен для C.elegans. В геноме нематод присутствуют два гена подсемейства SMC4 — собственно SMC4, отвечающий за митотическую конденсацию хроматина и Dpy 27, участвующий в дозовой компенсации генов Х-хромосом у гермафродитов с генотипом XX. Данные гены значительно дивергировали друг от друга и выравнивание между ними возможно лишь в районах, кодирующих консервативные домены (Ka/Ks для района Да-бокс генов SMC4 и Dpy 2 7 составляет 0,197). I
Вопрос об участии генов SMC в процессе дозовой компенсации генов Х-хромосом у самок высших млекопитающих пока еще остается открытым. Поиск в базах данных геномов мыши, человека и крысы последовательностей, кодирующих консервативные домены белков SMC, не выявил дополнительных генов, кроме уже известных SMCla, SMCip, SMC2-6. Таким образом, хотя специальных генов (как Dpy27 у C.elegans) у млекопитающих нет, однако, по всей видимости, список неканонических (помимо когезии и конденсации хроматид) функций белков семейства SMC пока еще не закрыт. Мы по-прежнему не исключаем возможности того, что продукты генов SMC тем или иным образом связаны с реорганизацией структуры ДНК инакивируемой X хромосомы у самок высших млекопитающих.
