Исследование функциональных особенностей CpG островов, в частности участвующих в инициации транскрипции во внутригенных и межгенных областях генома человека, методами биоинформатики тема диссертации и автореферата по ВАК РФ 03.01.03, кандидат биологических наук Медведева, Юлия Анатольевна
- Специальность ВАК РФ03.01.03
- Количество страниц 153
Оглавление диссертации кандидат биологических наук Медведева, Юлия Анатольевна
Актуальность темы исследования.
Объект и метод исследования.
Цель и задачи исследования.
Научная новизна диссертационного исследования.
Практическая значимость исследования.
Апробация диссертационного исследования.
Структура и объем диссертационного исследования.
Обзор литературы
Подходы к определению СрО островов.
Функциональный подход.
Структурный подход и алгоритмы поиска СрО островов.
Верификация результатов
Нерешенные вопросы.
Глава 1. Свидетельства функциональной значимости Срв островов, полученные методами сравнительной геномики
1.1. СрО острова не являются результатом случайных флукгуаций нуклеотидного состава.
1.2. СрО острова пересекаются с белок-кодирующими экзонами
1.3. Пересечение СрО островов и экзонов не объясняется повышенным С+О составом экзонов.
1.4. Внутри СрО острова снижен уровень синонимичных замен в СрО-содержащих кодонах
1.5. Резюме.
Глава 2. Транскрипционная активность ДНК в районе Срв островов любой геномной локализации
2.1. Обогащение СрО островов всех локализаций 5'-фрагментами кДНК.
2.2. СрО острова во всех областях генома обогащены участками специфического связывания фактора инициации транскрипции Бр
2.3. Данные, полученные методом иммунопреципитации хроматина, подтверждают, что белок Бр1 часто связывает ДНК внутри СрО островов.
2.4. СрО острова, обогащенные 5'-фрагментами кДНК и расположенные далеко от точки инициации транскрипции белок-коди-рующих генов, часто ассоциированы с инициацией транскрипции длинных некодирующих РНК
2.5. Резюме.
Глава 3. Характерные свойства последовательностей нуклеотидов ДНК в окрестностях точки инициации транскрипции
3.1. Кластеры 5'-фрагментов кДНК обогащены гуанином и цитози-ном, причем наблюдается асимметрия нуклеотидного состава вблизи точки инициации транскрипции.
3.2. В кластерах 5'-фрагментов кДНК, обедненных С или О, тем не менее статистически перепредставлены тракты соответственно поли-С и поли-О
3.3. В кластерах 5'-фрагментов кДНК разных типов перепредставлены варианты участков связывания белка Бр1, состоящие из редких нуклеотидов.
3.4. Резюме.
Глава 4. Особенности мутационного процесса в Срв островах
4.1. Снижение частоты мутаций CpG>TpG(CpA) внутри CpG острова не объясняется различиями в уровне метилирования CpG острова и остального генома.
4.2. Частота мутаций внутри динуклеотида, содержащего любые сочетания гуанина и цитозина, без снижения содержания G+C выше в CpG острове.
4.3. Резюме.
Список принятых сокращений
Введение диссертации (часть автореферата) на тему «Исследование функциональных особенностей CpG островов, в частности участвующих в инициации транскрипции во внутригенных и межгенных областях генома человека, методами биоинформатики»
Актуальность темы исследования
В настоящее время большое значение придается изучению эпигенетических механизмов, влияющих на реализацию генетической информации. Развитие экспериментальных методов молекулярной биологии позволило получить не только нуклеотидные последовательности геномов различных организмов, но и их эпигенетические профили на различных стадиях развития и в различных тканях организма. Вследствие этого становится особенно важным понять взаимосвязь между генетическими и эпигенетическим механизмами хранения, реализации и передачи наследственной информации. Одним из связующих звеньев между генетическими и эпигенетическими механизмами наследственности, по-видимому, являются особые сегменты ДНК, называемые СрО островами. Эти участки ДНК обладают специфическим составом нуклеотидов и динуклеотидов, и часто отличаются тем, что присутствующий в них цитозин в положении перед гуанином подвергается метилированию существенно реже, чем в среднем по геному.
Как это ни удивительно, несмотря на многочисленные работы, доказывающие участие СрО островов во множестве процессов в клетке, до сих пор не существует общепризнанного классифицирующего определения этих участков. Чаще всего для определения СрО островов используются алгоритмы т яШсо, которые можно разделить на две категории: алгоритмы «скользящего окна» и алгоритмы кластеризации. В алгоритмах обоих типов используются пороги, не имеющие достаточного биологического обоснования. Верификация результатов работы алгоритмов затруднена в связи с множеством процессов, имеющих отношение к образованию, поддержанию и функционированию СрО островов. В частности, все попытки создать алгоритм, который бы определял СрО острова на основании некоторой единственной функции (СрО острова в 5' области генов, участки, с неметилированными СрО динуклеотидами и т.д.), приводили к высокому проценту ложно-положительных предсказаний. Вполне вероятно, что каждое из имеющихся на данный момент определений СрО островов выделяет «химерный» класс ДНК сегментов, для которых не существует общей молекулярной структуры или функции.
Выделение функционально однородных СрО островов должно облегчить дальнейшее исследование эпигенетических механизмов. Данная работа направлена на изучение механизмов, ответственных за формирование СрО островов, что в перспективе должно дать возможность построения алгоритма определения функционально однородных СрО островов т зШсо.
Объект и метод исследования
Объектом исследования являются СрО острова в геноме человека и структурные элементы внутри них, особое внимание уделяется СрО островам, расположенным на относительном удалении от точки инициации транскрипции известных белок-кодирующих генов.
Основным методом, применяемым в диссертационном исследовании, является теоретический анализ публично доступных экспериментальных данных.
Цель и задачи исследования
Основной целью данного исследования является определение молекулярных свойств СрО островов, расположенных вдали от стартов транскрипции известных генов, выявление их внутренней структуры, факторов стабилизирующего отбора, поддерживающего наличие СрО островов, и описание особенностей мутационного процесса внутри СрО островов в геноме человека.
Достижение поставленных целей предполагает решение следующих задач.
• Проверка гипотезы о том, что CpG острова вдали от точек инициации транскрипции известных белок-кодирующих генов не являются артефактом метода теоретического определения CpG островов.
• Определение величины давления отбора внутри CpG островов разных локализаций.
• Описание особенностей мутационного процесса внутри CpG островов.
• Выявление общих и отличительных структурных свойств CpG островов, расположенных вблизи и вдали от стартов известных генов.
• Определение особенностей первичной структуры ДНК вблизи точек инициации транскрипции.
Научная новизна диссертационного исследования
В данной работе было впервые в масштабе полного генома показано, что CpG острова в значительной степени пересекаются с белок-кодирующими экзонами, что не удается объяснить аминокислотным составом кодируемого белка. Показано, что в пределах CpG островов, перекрывающиеся с экзонами, и расположенных в любой области гена наблюдается снижение уровня синонимичных замен в CpG-содержащих кодонах, что указывает на наличие давления отбора. Кроме того, CpG острова, расположенные в любой области генома, содержат точки инициации транскрипции, определенные методом анализа экспрессии генов путем захвата за модифицированный 5'-конец РНК (Cap-analysis gene expression, CAGE), а также участки связывания фактора инициации транскрипции Spl.
Показано, что участки ДНК, содержащие большое число точек инициации транскрипции на данной цепи, обладают повышенным содержанием гуанина на кодирующей цепи. При этом цитозин, присутствующий на данной цепи в меньшем количестве, имеет тенденцию кластеризоваться в полинук-леотидные тракты и мотивы, подобные участкам специфического связывания фактора инициации транскрипции 8р1.
Также в работе было продемонстрировано, что мутационный процесс в СрО острове имеет существенные характерные особенности. Замены СрО>ТрО (СрА) в СрО острове встречаются реже, чем вне СрО острова. Данный эффект не объясняется исключительно меньшим уровнем метилирования цитозина в СрО острове и сохраняется, если исследовать только цитозины, метилированные в клетках, близких к зародышевой линии. Уровень замен СС, СО, ОС, ОО в любых направлениях, не снижающих общего ОС содержания, значимо выше в СрО островах в сравнении с остальным геномом.
Практическая значимость исследования
Полученные в работе свидетельства транскрипционной активности СрО остовов, удаленных от точек инициации транскрипции известных белок-кодирующих генов, указывает на необходимость пересмотра концепции полногеномной транскрипции как явления, происходящего крайне редко. Под контролем перекрывающихся СрО островами промоторов могут синтезироваться неизвестные ранее типы молекул некодирующей РНК. В последнее время идет активное накопление данных о полиморфизмах, ассоциированных с различными наследственными заболеваниями, и не затрагивающих никаких известных белок-кодирующих генов. Можно предположить, что подобные полиморфизмы влияют на промоторы, контролирующие синтез нкРНК. Таким образом, результаты нашей работы позволяют выявить участки ДНК, не участвующие в синтезе мРНК, но важныес точки зрения молекулярной биологии и молекулярной медицины. Кроме того, полученные результаты о взаимодействии метилирования и мутационного процесса внутри СрО островов могут быть использованы при изучении механизмов возникновения болезней, связанных с изменением эпигенома, таких как рак, диабет, болезнь Альцгеймера и др.
Полученные в работе сведения о структурно-функциональных элементах, связанных с точками инициации транскрипции, могут быть использованы для построения алгоритма определения функционально-однородных СрО островов.
Апробация диссертационного исследования
Основные результаты работы были представлены на Московской Конференции по Вычислительной и Молекулярной Биологии в 2005, 2007 и 2009 гг., на Международной школе «Биоинформатика, геномика, протеомика» в Алматы в 2006 г., на Российско-Германской школе им. Гельмгольца по Системной Биологии в Москве в 2008 г., на Международной Конференции по Исследованиям в Области Вычислительной Молекулярной Биологии в Сингапуре в 2008 г., на конференции «Биоинформатика, Геномной Регуляции и Структуры» в Новосибирске в 2008 г., на Конференциях Европейского Научного Фонда «Функциональная геномика и заболевания» в Инсбруке, Австрия, в 2008 г. и в Дрездене, Германия, в 2010 г.
По материалам диссертации опубликовано 12 печатных работ, включая 3 статьи в реферируемых научных журналах, а также материалы докладов на научных конференций.
Апробация диссертационного исследования проведена на заседании секции «Молекулярная биология» Ученого Совета ФГУП «ГосНИИгснетика».
Структура и объем диссертационного исследования
Диссертационное исследование, изложенное на 153 листах машинописного текста, включает в себя введение, обзор литературы, четыре главы, содержащие результаты и обсуждение, заключение, выводы и библиографический список из 255 наименований. Работа содержит 10 рисунков и 13 таблиц.
Заключение диссертации по теме «Молекулярная биология», Медведева, Юлия Анатольевна
1. CpG острова имеют тенденцию пересекаться с белок-кодирующими экзонами, особенно это характерно для CpG островов в 3' области генов, причем эту тенденцию не удается объяснить повышенным C+G составом экзонов.
2. Во всех областях гена в CpG-содержащих кодонах синонимичные замены встречаются реже в тех экзонах, которые пересекаются с CpG островом.
3. CpG острова, расположенные вдали от точек инициации транскрипции известных белок-кодирующих генов, обогащены 5'-фрагментами кДНК, определенными методом анализа экспрессии генов путем захвата за модифицированный 5'-конец РНК.
4. CpG острова во всех областях генома обогащены участками специфического связывания белка Spl. CpG острова, демонстрирующие активную транскрипцию, содержат особенно сильные участки связывания белка Spl. Особенно этот эффект выражен у CpG островов в 3' области генов.
5. Внутригенные и межгенные CpG острова, демонстрирующие активную транскрипцию, часто ассоциированы со стартами транскрипции длинных некодирующих РНК.
6. Кластеры 5'-фрагметов кДНК обогащены гуанином и цитозином, причем наблюдается асимметрия нуклеотидного состава. В кластерах 5'-фрагметов кДНК, обедненных цитозином (гуанином), тем не менее статистически перепредставлены тракты поли-С/поли-G, а также участки связывания белка Spl в вариантах CCCCCGCCCCC / GGGGGCGGGGG.
7. Мутационный процесс внутри СрО острова существенно отличается от остального генома, в частности, вероятность мутации метилированного цитозина в СрС парах внутри острова меньше, чем в остальном геноме.
Список принятых сокращений
ObscpG/ExpcpG отношение наблюдаемого числа слов к ожидаемому, исходя из локально нуклеотидного состава;
НКО некодирующия область;
ТИТ точка инициации транскрипции;
ДМР дифференциально-метилированный район;
CAGE cap analysis of gene expression (анализ экспрессии генов методом захвата за модифицированный 5'-конец РНК); кластер(+) кластер близко расположенных геномных выравниваний 5'-фрагментов кДНК, статистически значимое большинство которых выравнивается на цепь, представленную в hgl8; кластер(—) аналогично предыдущему, но на комплементарную hgl8 цепь;
МПВ матрица позиционных весов.
Список работ, опубликованных по теме диссертации
Научные журналы
1. Medvedeva YA, Fridman MV, Oparina NJ, Malko DB, Ermakova EO, Ku-lakovskiy IV, Heinzel A, Makeev YJ (2010). Intergenic, gene terminal, and intragenic CpG islands in the human genome. BMC Genomics. 11:48.
2. Y. Medvedeva, A. Favorov, N. Oparina, I. Kulakovsky, V. Makeev (2010). Clusters of transcription start sites in human genomes exhibit a biased orientation of Spl binding site towards the template strand. New Biotechnology, 27:S1, 2010, S23.
3. Ю.А. Медведева, И. В. Кулаковский, Н.Ю. Опарина, А.В. Фаворов, В.Ю. Макеев (2010). Асимметрия GC-состава в окрестностях стартов транскрипции (с участием полимеразы РоШ) и ее связь с расположением участков адсорбции белка Spl на ДНК, Биофизика, том 55, вып. 6, 976-985.
Материалы конференций
1. Medvedeva Ju., Rychkov A., Oparina N. (2005). Imprinted genes in human and mouse genomes: detailed analysis of CpG islands. Proceedings of the 2nd Moscow Conference on Computational Molecular Biology, Moscow, 226.
2. Medvedeva Ju., Fridman M., Oparina N., Makeev V. (2006). CpG islands distribution in the human genome. Proceedings of the International school on genomics, proteomics and bioinformatics, Almaty, Khazakhstan, 46.
3. Julia Medvedeva, Irina Abnizova, Fedor Naumenko, Nika Oparina, Vsevolod Makeev (2007). Identification of CpG island boundaries. Proceedings of the 3d Moscow Conference on Computational Molecular Biology, Moscow, 205.
4. Ju.A. Medvedeva, M.V. Fridman, N.Ju. Oparina, D.B. Malko, E.O. Ermakova, V.Ju. Makeev. (2008) Reduced level of synonymous substitution in CpG containing codons suggests functional role of intragenic and 3' CpG islands in human genes. Proceedings of Helmholtz Russian-German Workshop on System Biology, Moscow, 50.
5. Ju.A. Medvedeva, M.V. Fridman, N.Ju. Oparina, D.B. Malko, E.O. Er-makova, V.Ju. Makeev (2008). Reduced CpG mutation rate suggests functional role of intragenic and 3' CpG islands in human genes. Proceedings of 12th International Conference on Research in Computational Molecular Biology, Singapore, Singapore, 75—76.
6. Ju.A. Medvedeva, M.V. Fridman, N.Ju. Oparina, D.B. Malko, E.O. Er-makova, V.Ju. Makeev (2008). Reduced level of synonymous substitution in CpG containing codons suggests functional role of intragenic and 3' CpG islands in human genes. Proceedings of the 6th International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, 158.
7. Y. Medvedeva, M. Fridman, N. Oparina, D. Malko, E. Ermakova, I. Ku-lakovskiy, V. Makeev (2008). Non-5'CpG islands in the human genome: probable involvement in transcriptional regulation. Сборник трудов конференции «Информационные технологии и системы», Геленджик, 298—299.
8. Y. Medvedeva, М. Fridman, N. Oparina, D. Malko, E. Ermakova, I. Ku-lakovslciy, V. Makeev (2008). Evidence for transcriptional regulation by nans' CpG islands in the human genome. Proceedings of the 3d ESF Conference on Functional Genomics and Diseases, Innsbruck, Austria, 89.
9. Y. Medvedeva, N. Oparina, V. Makeev (2009). Inner structure of CpG islands. Proceedings of the 4th Moscow Conference on Computational Molecular Biology, Moscow, 234.
