Разработка подходов для исследования патогенности вариантов нуклеотидной последовательности с использованием функционального анализа тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Скоблов Михаил Юрьевич
- Специальность ВАК РФ00.00.00
- Количество страниц 53
Оглавление диссертации доктор наук Скоблов Михаил Юрьевич
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
Актуальность темы исследования
Степень разработанности темы исследования
Цель исследования
Задачи, решаемые в ходе исследования:
Положения, выносимые на защиту
Научная новизна
Теоретическая и практическая значимость работы
Степень достоверности полученных результатов
Апробация работы
Личный вклад автора
Публикации
Методология и методы исследования
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Глава 1. Разработка и применение биоинформатических подходов для анализа патогенности вариантов нуклеотидной последовательности
1.1 Разработка алгоритма для предсказания патогенности миссенс вариантов
1.2 Разработка оптимизированного алгоритма «SpHceAI-reforged» для предсказания влияния вариантов на сплайсинг
1.3 Разработка алгоритма для предсказания патогенности вариантов в сайтах связывания с микроРНК
1.4 Разработка алгоритма для аннотации вариантов в иОЯР находящихся в 5'нетранслируемых областях генов
Глава 2. Разработка и применение экспериментальных подходов для анализа структуры и экспрессии мРНК на нативных образцах пациентов с наследственными заболеваниями
2.1 Разработка таргетных систем РНК-анализа для исследования патогенности вариантов сплайсинга на доступном биоматериале пациентов с наследственными заболеваниями
2.2. Разработка систем РНК-анализа для поиска патогенных вариантов и событий сплайсинга на доступном биоматериале пациентов с наследственными заболеваниями
Глава 3. Разработка и применение экспериментальных подходов для исследования патогенности вариантов сплайсинга на основе системы минигенов
3.1 Разработка системы минигенов для исследования патогенности вариантов сплайсинга in vitro
3.2 Примеры использования разрабатываемых систем минигенов для исследования патогенности вариантов сплайсинга in vitro
3.3 Подавление включения псевдоэкзонов гена SCN1A с помощью модифицированных антисмысловых UT-мяРНК
Глава 4. Разработка и применение экспериментальных подходов для исследования патогенности регуляторных вариантов нуклеотидной последовательности
4.1 Использование люциферазной системы для проведения функционального анализа 5'UTR вариантов
4.2. Использование люциферазной системы для проведения функционального анализа 3'UTR вариантов
Глава 5. Разработка и применение экспериментальных подходов для исследования патогенности белок-кодирующих вариантов нуклеотидной последовательности
5.1 Разработка экспериментальных подходов для исследования патогенности белок-кодирующих вариантов на доступном биоматериале пациентов с наследственными заболеваниями
5.2 Разработка экспериментальных подходов для исследования патогенности белок-кодирующих вариантов на основе in vitro систем
Глава 6. Алгоритм функционального анализа для установления патогенности вариантов нуклеотидной последовательности
ЗАКЛЮЧЕНИЕ
ВЫВОДЫ
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ АВТОРОМ ПО ТЕМЕ ДИССЕРТАЦИИ
БЛАГОДАРНОСТИ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Исследование механизмов патогенности вариантов нуклеотидной последовательности гена PAX6, выявленных у пациентов с врожденной аниридией2022 год, кандидат наук Филатова Александра Юрьевна
Исследование патогенности вариантов нуклеотидной последовательности в гене SCN1A, влияющих на сплайсинг2024 год, кандидат наук Спарбер Пётр Андреевич
Функциональная характеристика микроРНК-мРНК интерактома человека2021 год, кандидат наук Кудряшова Ольга Михайловна
Вариабельность генов саркомерных белков при гипертрофии миокарда различного генеза2023 год, кандидат наук Валиахметов Наиль Раушанович
Изучение фено-генотипических характеристик спорадического и наследственного рака желудка у пациентов российской популяции2025 год, кандидат наук Данишевич Анастасия Михайловна
Введение диссертации (часть автореферата) на тему «Разработка подходов для исследования патогенности вариантов нуклеотидной последовательности с использованием функционального анализа»
ВВЕДЕНИЕ Актуальность темы исследования
Внедрение технологий секвенирования нового поколения (NGS) в рутинную диагностическую практику привело к существенному увеличению выявления патогенных вариантов у пациентов с наследственными заболеваниями. Однако несмотря на это, больше половины пациентов не получают молекулярно-генетического диагноза. Одной из причин этого являются скудные знания о функциональности элементов генома и значимости генетических изменений в них. Поэтому для значительной части впервые выявляемых генетических изменений при проведении ДНК-диагностики клиническая значимость остаётся неизвестной.
Для оценки патогенности вариантов нуклеотидной последовательности и их каузативности были разработаны многочисленные международные рекомендации, такие как критерии Американской коллегии медицинской генетики и геномики (ACMG), включающие анализ биоинформатических данных, функциональных исследований, частоты вариантов в популяциях и данных о семейной сегрегации. Эти подходы позволяют объективно интерпретировать клиническое значение генетических изменений, однако часто этого бывает недостаточно и вариант так и остается «вариантом неясного значения». В таких случаях единственным способом подтверждения патогенности варианта является проведение функционального анализа с использованием экспериментальных систем in vitro или in vivo. Разработка систем для проведения функционального анализа для исследования патогенности генетических изменений не только необходима для корректного медико-генетического консультирования семей и установления риска повторного рождения больного ребенка, но и позволяет установить молекулярный этиопатогенез заболеваний, что может быть использовано в перспективе для подбора таргетной терапии для пациентов с наследственной патологией.
Степень разработанности темы исследования
До проведения данной работы исследования патогенности вариантов нуклеотидной последовательности с помощью функционального анализа в России практически не проводились. За рубежом такие исследования, хотя и осуществлялись, были, в основном, узконаправленными и фокусировались на решении конкретных задач, таких как анализ отдельных генов или определённых типов генетических вариантов. Эти работы как правило выполняются узкими специалистами, глубоко разбирающимися в конкретной области, что ограничивает возможность применения комплексного подхода к изучению патогенности генетических вариантов. Поэтому комплексные подходы, позволяющие исследовать широкий спектр генетических изменений и их влияние на различные молекулярные процессы, до сих пор остаются редкими. Это связано с необходимостью интеграции биоинформатических методов, экспериментальных
подходов и клинических данных, что требует междисциплинарного сотрудничества и значительных ресурсов.
Разработка подходов по исследованию патогенности вариантов нуклеотидной последовательности является новым направлением как в России, так и за рубежом. Данное исследование вносит значительный вклад не только в российскую науку, но и в мировую практику, предлагая новые методы для анализа патогенности генетических вариантов. Подобные разработки создают новые возможности для улучшения диагностики наследственных заболеваний, понимания их молекулярно-генетических механизмов и разработки персонализированных терапевтических подходов.
Цель исследования
Разработка подходов для исследования патогенности вариантов нуклеотидной последовательности, выявленных у пациентов с наследственными заболеваниями с использованием функционального анализа.
Задачи, решаемые в ходе исследования:
1. Разработать и применить биоинформатические подходы для анализа патогенности вариантов нуклеотидной последовательности.
2. Разработать и применить экспериментальные подходы для анализа структуры и экспрессии мРНК в образцах биоматериала пациентов с наследственными заболеваниями.
3. Разработать и применить экспериментальные подходы для исследования патогенности вариантов сплайсинга на основе системы минигенов.
4. Разработать и применить экспериментальные подходы для исследования патогенности регуляторных вариантов нуклеотидной последовательности.
5. Разработать и применить экспериментальные подходы для исследования патогенности белок-кодирующих вариантов нуклеотидной последовательности.
6. На основе проведенных исследований разработать алгоритм проведения функционального анализа для установления патогенности вариантов нуклеотидной последовательности.
Положения, выносимые на защиту
1. Разработанные биоинформатические и экспериментальные подходы для анализа патогенности вариантов нуклеотидной последовательности, включая использование систем РНК-анализа, минигенных конструкций и люциферазных систем, доказали свою эффективность для исследования патогенности вариантов в генах, связанных с наследственными заболеваниями.
2. РНК-анализ, проведённый на биоматериале пациентов, может быть использован в целях диагностики наследственных заболеваний и выявлять изменения событий сплайсинга, патогенные варианты в экзонах исследуемых генов, аллельный
дисбаланс транскриптов, характеризовать механизмы нонсенс-опосредованной деградации (NMD).
3. Для успешной разработки систем на основе плазмид, экспрессирующих минигены, корректно воспроизводящих сплайсинг референсных транскриптов исследуемых генов, необходимо применять различные подходы по улучшению распознавания клонированных экзонов: изменение размера геномного окружения клонируемого экзона, снижение силы плазмидного промотора, модификация плазмидного интрона, модификация цис-регуляторных элементов сплайсинга.
4. Разработан эффективный алгоритм для проведения функционального анализа с целью установления патогенности вариантов нуклеотидной последовательности, который включает биоинформатический прогноз, экспериментальную валидацию и интерпретацию результатов. Алгоритм успешно применён для анализа патогенности вариантов, подтвердив свою эффективность и практическую ценность для диагностики наследственных заболеваний.
Научная новизна
1. Впервые разработаны биоинформатические программы для оценки анализа патогенности вариантов нуклеотидной последовательности: Bad-mut score для анализа миссенс вариантов, SpliceAI-reforged для вариантов способных влиять на сплайсинг, uORF_annotator для регуляторных вариантов, расположенных в 5'UTR (5'-untranslated region, 5'-нетранслируемый регион), и Exp-MiBR для регуляторных вариантов, расположенных в 3'UTR (3'-untranslated region, З'-нетранслируемый регион).
2. Разработанные методы РНК-анализа, проведённого на биоматериале пациентов с наследственными заболеваниями, впервые позволили исследовать патогенность 34 вариантов в генах ARSB, ASCC1, C19orfl2, CFTR, COL6A3, CTNS, EDA, EIF2S3, EXT1, EXT2, GAA, GLB1, HGD, KIAA1109, LIPA, LMNA, MICUl, MYH7, NPC1, PALB2, PTPN11, SNX14, SPART, TCF4, TBCE.
3. Разработанные методы РНК-анализа для генов CTNS, C19orf12, EIF2S3, EXT1, EXT2 и PALB2 впервые позволили выявить новые патогенные варианты, изменения сплайсинга и аллельный дисбаланс транскриптов.
4. Разработанные различные подходы для улучшения работы минигенных конструкций, необходимых для корректного проведения анализа патогенности вариантов сплайсинга, впервые позволили исследовать патогенность 193 вариантов нуклеотидной последовательности в генах C19orf12, CFTR, CLCN1, COL2A1, EDA, GLB1, HGD, LIPA, LMNA, MPZ, MYBPC3, MYH7, NPC1, ORC6, PALB2, PAX6, PCCA, PCCB, SCN1A, SCN2A, SH3TC2, TCF4.
5. Разработанные методы с использованием модифицированных антисмысловых и7-мяРНК впервые позволили провести эффективное подавление включения глубоко-интронных псевдоэкзонов гена SCN1A.
6. Разработанные люциферазные системы, содержащие 5'UTR генов COL2A1, ETFDH, GLI2, HTT, LAT, MAPRE2, MAST1, PAX6, PAX9, POMC, RPS7, SET, TTN, ZIC2, и
содержащие 3'UTR генов CDK6, TF, TMEM107, впервые позволили провести исследование патогенности 29 и 4 генетических вариантов соответственно.
7. Разработанные подходы для исследования патогенности белок-кодирующих вариантов, как на биоматериале пациентов в генах COL6A3, DES, NPC1 и TBCE, так и с помощью исследований in vitro в генах KRT25, PHACTR1 и TBCE, впервые позволили изучить патогенность 4 и 5 вариантов соответственно.
8. Впервые разработан алгоритм проведения функционального анализа для установления патогенности вариантов нуклеотидной последовательности, что способствует более эффективной работе по исследованию генетических заболеваний.
Теоретическая и практическая значимость работы
Теоретическая значимость данной работы заключается в разработке методологических подходов к изучению патогенности вариантов нуклеотидной последовательности с применением функционального анализа. Эти подходы представляют собой важный инструмент для более глубокого понимания молекулярных механизмов, лежащих в основе различных генетических заболеваний. Результаты исследований могут привести к более точной оценке патогенности генетических вариантов, что имеет критическое значение для диагностики, прогнозирования и лечения генетически обусловленных заболеваний.
Практическая значимость работы по разработке подходов по исследованию патогенности вариантов нуклеотидной последовательности с помощью функционального анализа чрезвычайна востребована в области медицинской генетики. Среди ключевых направлений её использования можно выделить следующие:
1. Совершенствование диагностики генетических заболеваний. Исследование функциональных эффектов генетических вариантов помогает определить их патогенность и влияние на развитие болезней, что может помочь в улучшении точности диагностики генетических заболеваний и использования более ранних и эффективных мер по их предотвращению и лечению. Полученные результаты имеют важнейшее значение для корректного медико-генетического консультирования пациентов. Разработанные в ходе исследования системы внедрены в практику ФГБНУ «Медико-генетический научный центр имени академика Н.П. Бочкова».
2. Разработка персонализированных подходов к лечению. Понимание того, как генетические варианты влияют на молекулярные механизмы, позволяет разрабатывать индивидуализированные методы лечения, направленные на конкретные молекулярные дефекты и на коррекцию молекулярных дефектов, вызывающих генетические заболевания.
3. Расширение знаний о фундаментальных молекулярных процессах. Проведение функционального анализа генетических вариантов способствует углублению понимания молекулярно-генетических механизмов как в норме, так и при патологии, что имеет важное значение не только для развития медицины, но и для углубления фундаментальных знаний в области биологии.
Степень достоверности полученных результатов
Достоверность результатов определяется использованием современных экспериментальных и вычислительных подходов с необходимым количеством контрольных экспериментов с рационально обоснованными размерами выборки и подтверждается публикацией результатов в высокорейтинговых рецензируемых журналах.
Апробация работы
Результаты работы представлены на международных и всероссийских конференциях: European Human Genetics Conference 2015 (June 3-9, 2015, Glasgow, Scotland), 4th Global Congress for Consensus in Pediatrics and Child Health (March 19-22,
2015, Budapest, Hungary), 58-я научная конференция МФТИ (23-28 ноября 2015 года, г. Долгопрудный), European Society of Human Genetics 2016 (May 21-24, Barcelona, Spain), Virginia Academy of Science 94th Annual Meeting (May 18-20, 2016, Fredericksburg, USA), Systems biology and bioinformatics (SBBI'2016) (June 30 - July 2, 2016, St. Petersburg), The International Symposium Systems Biology and Biomedicine (SBioMed-2016) (August 30-31,
2016, Novosibirsk), 3rd European Aniridia Conference (26th-28th Aug., 2016, Duisburg, Germany), Вторая международная научно-практическая конференция «NGS в медицинской генетики» (26-28 апреля 2017, г.Суздаль), Всероссийский научно-практический конгресс с международным участием «Орфанные болезни» (1-3 июня 2017 г., г. Москва), European human genetics conference 2017 (ESHG 2017) (May 27 - 30, 2017, Copenhagen, Denmark), Moscow Conference on Computational Molecular Biology (MCCMB2017) (July 27-30, 2017, Moscow), Future of Biomedicine (10-15 September, 2017, Vladivostok, Russia), 60-я Всероссийская научная конференция МФТИ (20 - 26 ноября
2017 года, Москва, Долгопрудный), Молекулярная диагностика — 2017 (18-20 Апреля
2017, Москва), III Ежегодный Конгресс Российского общества онкопатологов (20-21 апреля 2018, г.Казань), Третья международная научно-практическая конференция «NGS в медицинской генетики» (25-27 апреля 2017, г.Суздаль), The 4th International Seminar "Life of Genomes -2018" (22-24-May, 2018, Kazan), European Human Genetics Conference
2018 (16-19 June 2018, Milan, Italy), 2nd International Caparica Conference in splicing (16th - 19th July 2018 Lisbon, Portugal), 11th International Multiconference «Bioinformatics of Genome Regulation and Structure\ Systems Biology» (20 - 25 August 2018 Novosibirsk, Russia), European Human Genetics Conference ESHG'2019 (15-18 June, 2019, Gothenburg, Sweden), Moscow conference in computational molecular biology (MCCMB'2019) (July 2730th 2019, Moscow), Четвертая международная научно-практическая конференция «NGS в медицинской генетике 2019» (24-26 апреля 2019 года, г. Суздаль), Future of Biomedicine
2019 ( September 17 - 26, 2019, Vladivostok, Russia), 3rd International Caparica Conference in Splicing 2020 (13th - 16th July 2020 Caparica, Portugal), Moscow Conference on Computational Molecular Biology (July 30th — August 2nd, 2021. Moscow, Russia), Пятая международная научно-практическая конференция «NGS в медицинской генетики» (28-
30 апреля 2021, г.Суздаль), IX Съезд Российского общества медицинских генетиков (30 июня - 2 июля 2021г., Москва), European Human Genetics Conference ESHG'2021 (28-31 August 2021, Virtual conference), European Human Genetics Conference 2022 (June 11-14, 2022, Vienna, Austria), 8th Congress of the European Academy of Neurology - Europe 2022 (June 25-28, Vienna, Austria), 14th European Epilepsy Congress (July 9-13, Geneva, Switzerland), X Съезд Российского общества медицинских генетиков (16 августа 2021, Москва, Россия), Шестая международная научно-практическая конференция «NGS в медицинской генетики» (27-29 апреля 2022, г.Суздаль), I Ежегодная конференция Московского общества медицинских генетиков с международным участием (19-20 мая 2022, Москва, Россия), Bioinformatics of Genome Regulation and Structure/Systems Biology (BGRS/SB-2022): The Thirteenth International Multiconference (04-08 July 2022, Novosibirsk, Russia), Конференция «Эпилепсия - от гена до скальпеля: перезагрузка» (21 января 2023, Москва, Россия), Cедьмая Международная научно-практическая конференция «MGNGS'24» (24-26 апреля 2024, г. Суздаль), European Human Genetics Conference ESHG'2024 (June 1-4, Berlin, Germany), VI Всероссийский научно-практический конгресс с международным участием «Орфанные болезни» (20-21 июня 2024г., г. Москва), Третий форум по диагностике и лечению орфанных болезней с международным участием содружество без границ (23 октября 2024г., г. Москва), VI Международная конференция ПОСТГЕНОМ'2024 (29 октября - 2 ноября 2024г., г. Москва), II Всероссийская конференция имени В.С. Баранова «ПОЭЗИЯ ГЕНОМА» с международным участием (06-10 ноября 2024г., г. Санкт-Петербург),
Работа одобрена этическим комитетом и прошла экспертную комиссию, рекомендована к защите на заседании Диссертационного совета 24.1.168.01 при Федеральном государственном бюджетном научном учреждении «Медико-генетический научный центр имени академика Н.П. Бочкова» (ФГБНУ «МГНЦ»).
Личный вклад автора
Диссертационная работа обобщает результаты теоретических и экспериментальных исследований, проведенных непосредственно автором и в сотрудничестве с коллегами в период с 2015 по 2025 г. Личный вклад автора заключается в постановке целей и задач исследований, планировании экспериментов, анализе полученных данных, обработке и обобщении результатов, установлении закономерностей, формулировке выводов и подготовке рукописей к публикации. Все публикации по теме диссертационной работы подготовлены с личным участием и определяющим вкладом автора.
Публикации
Общий список публикаций по теме научного доклада включает 54 работы, опубликованные за период 2016-2025 гг. в журналах из баз данных Web of Science, Scopus, RSCI, рекомендованных ВАК при Минобрнауки России для соискателей ученой степени
доктора биологических наук. Из них 47 статей опубликованы в международных рецензируемых журналах с рейтингом Q1-Q2.
Методология и методы исследования
Объектами исследования являлись варианты нуклеотидной последовательности, выявленные у российских пациентов с наследственными заболеваниями или отобранные из научных статей и/или специализированных баз данных.
Материалом являлись: образцы биоматериала пациентов с наследственными заболеваниями из "Всероссийской коллекции биологических образцов наследственных болезней", созданной на базе ФГБНУ «МГНЦ», эукариотические иммортализованные клеточные линии (эмбриональной почки человека НЕК293Т и легочной карциномы человека А549), экспрессионные вектора, разработанные для анализа сплайсинга и анализа регуляторных вариантов.
Для комплексного биоинформатического анализа вариантов нуклеотидной последовательности по предсказанию их патогенетической значимости использовались как широкодоступные программы, так и самостоятельно разработанные в ходе выполнения данной работы. Для выполнения экспериментальной части работы использованы следующие молекулярно-генетические методы: создание экспрессионных конструкций, экспрессирующих минигены и конструкций с репортерным геном люциферазы, клонирование как геномных локусов, так и кодирующих участков генов в экспрессионные вектора, внесение в полученные конструкции исследуемых вариантов нуклеотидной последовательности с помощью сайт-направленного мутагенеза, ведение и пересев эукариотических клеточных культур, трансфекция клеточных линий, выделение тотальной РНК; постановка реакции обратной транскрипции, различные варианты полимеразной цепной реакции, определение люциферазной активности клеточных лизатов, фрагментный анализ, методы массового параллельного секвенирования, иммуногистохимическое исследование экспрессии и локализации белков, статистическая обработка полученных результатов.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Глава 1. Разработка и применение биоинформатических подходов для анализа патогенности вариантов нуклеотидной последовательности
Биоинформатический анализ вариантов нуклеотидной последовательности является первым и порой определяющим шагом при исследовании патогенности вариантов. Однако сами варианты могут находиться в любом месте генома и приводить к возникновению заболеваний путём нарушений огромного числа молекулярных механизмов. На сегодняшний день не существует универсальной биоинформатической программы, способной при анализе предсказывать все возможные функциональные повреждения генома. Поэтому эффективным подходом является разработка узкоспециализированных программ, способных предсказывать значимость конкретных генетических изменений или оценивать их влияние на конкретные механизмы.
1.1 Разработка алгоритма для предсказания патогенности миссенс вариантов
Миссенс варианты являются самой многочисленной группой генетических вариаций, встречающихся в экзонах генов человека. При этом оценка патогенности таких вариантов является одной из самых сложных, но и самых востребованных задач. Существует большое количество разных биоинформационных алгоритмов, способных предсказывать патогенность вариантов, однако все они обладают довольно низкими метриками, а получаемые ими данные о предсказаниях плохо согласуются друг с другом.
Для улучшения качества предсказаний были разработаны классификаторы патогенности, используя две модели глубокого обучения: многослойная нейронная сеть (персептрон (MLP)) и автоэнкодер со встроенным шумоподавлением (sdAE) [4]. Для тренировки алгоритмов машинного обучения была собрана информация о патогенности описанных вариантов из множества различных источников и баз данных. Для этого мы разработали высокомодульную модель глубокого обучения, включающую множество различных функций, включая обучаемую целевую токенизацию [5]. Всего было найдено 64,5x103 повреждающих и 32x103 нейтральных вариантов.
После тренировки алгоритмов машинного обучения была проведена сравнительная оценка показателей эффективности предсказаний с помощью ROC-анализа. Показано, что разработанные алгоритмы обладали одними из самых высоких показателей: для sdAE - AUC составил 0.92, для MLP - AUC составил 0.94 (рисунок 1).
Рисунок 1 - Сравнительная оценка показателей эффективности предсказаний с помощью ROC-анализа [5]. A. ROC-кривые, полученные различными предсказательными алгоритмами. MLP, Metal, MetaSVM, sDAE и MutationTaster показали наибольшую площадь под кривой. B. Данные по средней оценке точности с 95% доверительными интервалами
Разработанные классификаторы патогенности миссенс вариантов на основе моделей глубокого обучения обладали высокими метриками оценки: Fl-мера, коэффициент корреляции Мэтьюса (MCC), точность (таблица 1). Многослойная нейронная сеть MLP показала самые высокие значения метрик оценки среди существующих алгоритмов.
Таблица 1 - Метрики оценок различных предсказательных алгоритмов по кривой ROC с 95% доверительными интервалами [5]
Score Fl-score MCC Accuracy
CADD 0.64 (0.50) 0.43 (0.58) 0.74 (0.73)
DANN 0,60(0.51) 0.35 (0.53) 0.71 (0,85)
Eigen 0.61 (0.55) 0.43 (0.66) 0.77 (0.80)
FATHMM 0.79 (0.83) 0.67 (0.87) 0.85 (0.88)
GERP++ 0.57 (0.38) 0.30 (0.38) 0.67 (0.99)
I.RT 0.61 (0.441 0.37 (0.51t 0.71 (0 681
MLP 0.83 (0.68) 0.75 (0.69) 0.89 (0.70)
MetaLR 0.82 (0.83) 0.74 (0.83) 0.88 (0.88)
MetaSVM 0.81 (0.81) 0.72 (0.86) 0.88 (0.87)
Mutation Assessor 0.64 (0.73) 0.47 (0.81) 0.78 (0.85)
MutationTaster 0.63 (0.45) 0.41 (0.47) 0.72 (0.80)
PROVEAN 0.63 (0.55) 0.42 (0.60) 0.74 (0.79)
PolyPhen HDIV 0.63 (0.55) 0.42 (0.74) 0.75 (0.88)
PolyPhen HVAR 0.64 (0.59) 0.44 (0.59) 0.75 (0.77)
SIFT 0.64 (0.58) 0.44 (0.66) 0.76 (0.72)
SiPhy 29-way 0.59 (0.44) 0.33 (0.46) 0.67 (0.78)
phastCons 100-way 0.59 (0.39) 0.33 (0.68) 0.67 (0.78)
phvloP 100-wav 0.60 (0.51) 0.37 (0.62) 0.73 (0.7.3)
sdAE 0.81 (0.69) 0.72 (0.79) 0.88 (0.79)
1.2 Разработка оптимизированного алгоритма «SpliceAI-reforged» для предсказания
влияния вариантов на сплайсинг
Для предсказания влияния вариантов на сплайсинг самым эффективным алгоритмом является SpliceAI, представляющий собой 32-слойную глубокую нейронную сеть. Однако большим недостатком данного алгоритма является низкая производительность, которая при большом количестве выявляемых генетических изменений при ДНК-диагностике, является сильным ограничением для рутинного использования в практике.
Для увеличения производительности работы алгоритма мы переработали код исходного SpliceAI. Мы использовали оригинальные модели SpliceAI, оптимизировав интерфейс для запроса прогнозов. Полученная новая версия разработана для более эффективного использования распараллеливания графических процессов, чем исходная реализация. Она позволяет контролировать количество одновременно обрабатываемых записей (размер пакета) и их одновременную предварительную обработку. Важно отметить, что обученные модели были взяты непосредственно из исходной версии, поэтому новая версия программы выдаёт такие же предсказания, как и оригинальная.
В результате разработана новая версия алгоритма SpliceAI-reforged (https://github.com/skoblov-lab/spliceai-reforged), которая обеспечивает увеличение производительности в 3,5 раза, что позволяет моделям лучше масштабироваться для больших наборов данных.
1.3 Разработка алгоритма для предсказания патогенности вариантов в сайтах
связывания с микроРНК
МикроРНК-опосредованная регуляция экспрессии генов является одним из распространённых молекулярных механизмов. Однако существующие программы, предсказывающие микроРНК-мРНК взаимодействия (TargetScan, PicTar, PITA, RNA22 и Miranda), демонстрируют низкий уровень эффективности работы при данных с предсказанными взаимодействиями и экспериментально идентифицированными сайтами связывания с микроРНК [8].
Для аннотации вариантов нуклеотидной последовательности способных приводить к изменению связывания с микроРНК создана база данных достоверных, экспериментально идентифицированных сайтов связывания микроРНК человека. В неё вошли 46 тысяч регионов мРНК (exp-miBR), полученных в девяти клеточных линиях. Данные регионы были всесторонне охарактеризованы.
Разработана веб-программа "exp-miBR Annotator", позволяющая проводить поиск вариантов нуклеотидной последовательности генома человека в сайтах связывания с микроРНК (exp-miBR) [16].
1.4 Разработка алгоритма для аннотации вариантов в uORF находящихся в
5'нетранслируемых областях генов
Варианты нуклеотидной последовательности, расположенные в 5'-нетранслируемых областях генов, могут приводить к изменению трансляции основной открытой рамки считывания. Часто подобные изменения могут быть обусловлены генетическими вариантами, которые вызывают нарушение структуры uORF. В результате проведённого биоинформатического анализа нами проаннотировано около 4,5 тысяч малых открытых рамок считывания в генах, представленных в OMIM [39].
Чтобы аннотировать эффекты генетических вариантов в последовательностях uORF, создана программа «uORF_annotator», позволяющая анализировать, как варианты могут влиять на структуру малых открытых рамок считывания и тем самым нарушать трансляцию основной CDS (рисунок 2).
Рисунок 2 - Схема аннотированных uORF в гене ETFDH и визуализация результатов предсказаний с помощью «uORF_annotator» [39]. Трек "Variants in uORFs" отображает аннотированный вариант; трек "Affected ATG uORFs" показывает исходный uORF, в котором локализован вариант (черным цветом), и результирующий uORF (красным цветом)
Итоги первой главы основного содержания работы:
Разработаны биоинформатические программы по предсказанию патогенетической значимости для:
• миссенс вариантов (Bad-mut score);
• вариантов, способных влиять на сплайсинг (SpliceAI-reforged);
• регуляторных вариантов, расположенных в 5'UTR области (uORF_annotator);
• регуляторных вариантов, расположенных в 3'UTR (Exp-MiBR). Разработанные программы вместе с другими доступными программами
применялись для всестороннего комплексного биоинформатического анализа вариантов нуклеотидной последовательности, что является необходимым первым этапом для формирования гипотезы о молекулярных механизмах патогенности исследуемого варианта и грамотного определения стратегии проведения экспериментов функционального анализа.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Молекулярные основы генетической гетерогенности и клинической вариабельности наследственных периферических нейропатий2023 год, доктор наук Щагина Ольга Анатольевна
Ген сфингомиелинсинтазы I (SGMS1) человека: структурно-функциональная организация и особенности экспрессии в разных тканях2016 год, кандидат наук Рожкова Александра Валерьевна
Анализ генетического контроля наследственной потери слуха в популяциях ряда регионов Сибири2022 год, кандидат наук Данильченко Валерия Юрьевна
Генетическая гетерогенность и клиническая характеристика наследственных множественных остеохондром2024 год, кандидат наук Боровиков Артем Олегович
Генетические и фенотипические особенности врожденной аниридии в Российской Федерации2018 год, кандидат наук Васильева, Татьяна Алексеевна
Список литературы диссертационного исследования доктор наук Скоблов Михаил Юрьевич, 2025 год
H:jh / /
— —WT
— — Crî'SS — Skl9
V
Deletion cis-regulatory element
MG-WT
« 23 24 25 e g- ■ ■ 10
s
I
II
MG-del V
23
WT
. — — Sk24
Ö ¿i 24 25 H ISO-
Рисунок 13 - Примеры различных подходов, используемых для создания репортерной системы для сплайсинга 8СЫ1Л с надлежащим распознаванием тестируемых экзонов [49]
Рисунок 14 - Анализ варианта c.449+5G>A гена ORC6 в системе минигена in vitro [33]. А. Схема конструирования плазмиды для анализа в минигене. В. Результаты ОТ-ПЦР-анализа химерных транскриптов в агарозном геле. С. Результаты секвенирования продуктов сплайсинга
по Сэнгеру
Другим примером использования системы минигенов является клинический случай болезни Шарко-Мари-Тута. Мужчине 32 лет с диагнозом наследственная невропатия проведён генетический анализ методом высокопроизводительного секвенирования с использованием целевой панели, включающей 21 ген наследственных моторно-сенсорных невропатий. В результате выявили три варианта в двух генах, MPZ (c.449-9C>T) и SH3TC2 (c.279G>A и c.1177+5G>A), каждый из которых мог привести к развитию заболевания. Для того чтобы определить, изменение в каком из генов является истинной причиной заболевания, проведён функциональный анализ вариантов
сплайсинга. Полученные результаты показали, что вариант c.449-9C>T в гене MPZ не влияет на сплайсинг и не является причиной заболевания (рисунок 15А) [43], в то время как вариант c.1177+5G>A в SH3TC2 вызывает удержание интрона, что приводит к последующему нарушению рамки считывания (p.Ala393GlyfsTer2) (рисунок 15B).
А
MPZ minigene
[ C.449-9QT |
■зз——Ц 4
Р1Е1 Ехоп 10 Ехоп 11
Рисунок 15 - Функциональный анализ варианта c.449-9C>T в гене MPZ и варианта c.1177+5G>A в SH3TC2 с помощью системы минигенов [43]. А. Схема минигена MPZ, содержащего c.449-9C>T, и электрофореграмма продуктов ОТ-ПЦР. В. Схема минигена SH3TC2, содержащего c.1177+5G>A, и визуализация сплайсинговых соединений для c.1177+5G>A продуктов ОТ-ПЦР минигена полученных при глубоком таргетном
секвенировании (Sashimi plot)
При наличии большого количества вариантов в исследуемом гене целесообразно разрабатывать системы минигенов, включающие большое количество экзонов. Так, разработанная система из 4 минигенов позволяла проводить функциональный анализ вариантов сплайсинга для 5 экзонов гена РАХ6. Использование данной системы позволило успешно протестировать шесть интронных вариантов (c.142-5T>G, ^142-140^ аШ^А^, с.141+4А>^ с.1032+6Т>^ c.682+4delA), один миссенс (с.140А^) и один синонимичный вариант (с.174С>Т) (рисунок 16) [12].
Рисунок 16 - Результаты исследования вариантов сплайсинга в гене PAX6 с использованием системы экспрессии минигенов [12]. A. ОТ-ПЦР анализ влияния интронных вариантов c.142-5T>G, c.142-14C>G, c.142-64A> C и синонимичного варианта c.174C>T на сплайсинг; B. ОТ-
ПЦР-анализ влияния интронного варианта c.141+4A>G и миссенс варианта c.140A>G на сплайсинг; C. ОТ-ПЦР-анализ влияния интронного варианта c.682+4delA на сплайсинг; D. ОТ-ПЦР анализ влияния интронного варианта a!032+6T>G на сплайсинг
Важно подчеркнуть, что конечной точкой таких исследований является интерпретация обнаруженных изменений в структуре РНК. Так, для всех семи вариантов найдено, что изменения структуры РНК сопровождаются возникновением преждевременного стоп-кодона (рисунок 17). По данным литературы такие транскрипты гена PAX6 деградируют при активации механизма NMD, что согласуется с основным механизмом возникновения врождённой аниридии - гаплонедостаточностью.
Другим примером создания системы минигенов является ген SCN1A, для которого создано 18 частично перекрывающихся минигенов, содержащих все 26 белок-кодирующих экзонов гена (рисунок 18) [49]. Разработанная система покрывает 100% кодирующей области гена SCN1A и 51,5% всей последовательности гена (88661 п.н.) и может быть использована не только для исследования влияния на прохождение сплайсинга вариантов, локализованных у границ экзонов, но также для анализа глубоко-интронных вариантов, так как многие интроны гена SCN1A клонированы целиком.
Рисунок 17 - Схематичное изображение влияния исследуемых вариантов гена РАХ6 на структуру мРНК и возможных последствий на уровне белка [12]
Рисунок 18 - Схема системы плазмид, экспрессирующих мини/миди/максигены 8СЫ1А [49]. Экзоны гена 8СЫ1А указаны в виде прямоугольников, интроны - в виде горизонтальной линии между ними. Над схемой указаны вставки рабочих конструкций
С использованием разработанной системы проанализированы 68 интронных вариантов, локализованных вне каноничных динуклеотидов сайтов сплайсинга, выявленных у пациентов с различными эпилептическими фенотипами. Функциональный анализ 68 интронных ВНП установил нарушение прохождения сплайсинга для 56 вариантов (82,3%). Наиболее частым механизмом нарушения сплайсинга являлся пропуск одного или нескольких экзонов, который выявлен в половине случаев (34 варианта) (рисунок 19).
Интересно отметить, что не установлено влияние на прохождение сплайсинга 12 интронных вариантов (17,6%) несмотря на то, что все они описаны в литературе как патогенные и вероятно патогенные.
Также с помощью разработанной системы функциональный анализ выполнен и для 21 экзонного варианта нуклеотидной последовательности: 16 миссенс вариантов, трех синонимичных вариантов, одного нонсенс варианта и одной делеции без сдвига рамки считывания. Полученные данные показали влияние на прохождение сплайсинга 15 из 21 исследуемых вариантов (71,4%, 11 миссенс вариантов, 3 синонимичных и один нонсенс вариант) (рисунок 20) [49]. Вариант с.1985С>А (р^ег662Тег), оказался единственным исследуемым вариантом, где выявлено неполное влияние на прохождение сплайсинга с
остаточным количеством транскрипта, сплаисинг которого соответствовал сплаисингу референсной изоформы, что свидетельствует о его патогенности как на уровне РНК, так и на уровне белка (рисунок 20).
Рисунок 19 - Исследование влияния интронных вариантов нуклеотидной последовательности на прохождение сплайсинга в гене 8СЫ1Л [49]. А - расположение исследуемых интронных ВНП относительно границ экзона. Каждый круг представляет собой один ВНП. Разными цветами отмечены разные механизмы нарушения прохождения сплайсинга. Звездочкой отмечены ВНП с ложноотрицательными предсказаниями, согласно SpliceAI. В - Примеры результатов функционального анализа интронных ВНП с различными эффектами. В каждом случае представлена схема плазмиды, с расположением праймеров для ОТ-ПЦР, электрофорез результатов ОТ-ПЦР и схемы выявленных транскриптов с обозначением из размера
3.3 Подавление включения псевдоэкзонов гена SCN1A с помощью модифицированных
антисмысловых U7-мяРНК
Коррекция сплайсинга с помощью антисмысловых технологий является широко распространённым подходом для лечения наследственных заболеваний. При этом для тестирования разрабатываемых подходов можно применять минигенные конструкции, на которых проходили исследования влияния варианта на сплайсинг. Так, для подавления включения трёх псевдоэкзонов (ПЭ) гена БСЫЫ использовали систему по экспрессии модифицированных антисмысловых и7-малых ядерных РНК [45].
Делеция без сдвига рамки
C.42S5 12В7М
=> I__«
о-tm-п
1 I PIA I 25 I рТП WT 205 Ьр
2 I PIA I 25 I PIBl ЙЗЕ«15 202 Ьр
Рисунок 20 - Исследование влияния интронных вариантов нуклеотидной последовательности на прохождение сплайсинга в гене SCN1A [49]. А - расположение исследуемых экзонных ВНП относительно границ экзона. Каждый круг представляет собой один вариант. Разными цветами
отмечены разные механизмы нарушения прохождения сплайсинга. Б - Анализ сравнения уровня включения экзона после трансфекции плазмиды с вариантом, приводящим к неполному
нарушению сплайсинга. Каждый столбец отображает средний уровень включения экзонов ± SD. В - Примеры результатов функционального анализа экзонных ВНП разного типа. В каждом случае представлена схема плазмиды, с расположением праймеров для ОТ-ПЦР, электрофорез результатов ОТ-ПЦР и схемы выявленных транскриптов с обозначением их размера
Нонсенс
1 I 111 12 I 13 I 14 115IPIB I WT 1154 Ьр
2 111 11 | 131 la | 15 IPIBl M6J Е*14 987Ьр
Для эффективного подавления включения ПЭ гена 8СЫ1Л созданы 8 плазмид, содержащие модифицированные и7-мяРНК с антисмысловыми последовательностями, комплементарными сайтам сплайсинга ПЭ и биоинформатически предсказанным регуляторным мотивам. Плазмиды, содержащие модифицированные антисмысловые и7-мяРНК к ПЭ гена 8СЫ1Л, котрансфицировали в эквимолярных соотношениях в клеточную линию НЕК293Т. Котрансфекцию проводили с мутантной плазмидой, содержащей вариант приводящий к максимальному уровню включения соответствующего ПЭ (c.265+2143G>A для ПЭ4, с.4002+245Ш>С для ПЭ23 и е.4338+672Т>0) (рисунок 21).
Рисунок 21 - Подавление включения ПЭ гена 8СЫ1Л с помощью модифицированных антисмысловых и7-мяРНК [45]. А. Схема ПЭ4 с патогенным вариантом (сверху) и областью связывания модифицированных антисмысловых и7-мяРНК (черные прямоугольники). Расчет
среднего уровня пропуска ПЭ гена 8СЫ1Л при котрансфекции модифицированными антисмысловыми и7-мяРНК ± SD между 3 биологическими повторностями. Средний уровень включения указан в каждом столбце. В. Аналогично для ПЭ23. С. Аналогично для ПЭ25
В результате котранфекции мутантных плазмид с модифицированными антисмысловыми и7-мяРНК успешно было подавлено включения всех ПЭ гена SCN1A. Максимальный уровень подавления для ПЭ4 составил 81,8±5,4% (U7-1), для ПЭ23 -97,5±0,85% (U7-4) и для ПЭ25 - 99,3±0,6% (U7-8) (рисунок 21).
Итоги третьей главы основного содержания работы:
Система минигенов является эффективным инструментом по исследованию патогенности вариантов сплайсинга при отсутствии экспрессии гена в образцах из доступного биоматериала пациентов.
С помощью системы минигенов исследована патогенность вариантов сплайсинга расположенных как в интронах, так и в экзонах следующих генов: C19orf12 [7], CFTR [26], CLCN1 [19], COL2A1 [51], EDA [14], GLB1 [31], HGD [24], LIPA [10], MPZ [43], MYBPC3 [52], MYH7 [17], NPC1 [30], ORC6 [33], PALB2 [20], PAX6 [9, 12], PCCA [23], PCCB [23], SCN1A [29, 45, 49], SCN2A [35], SH3TC2 [43], TCF4 [18]. Проведённый анализ позволил впервые исследовать патогенность 193 вариантов.
Для исследования вариантов сплайсинга оптимальной стратегией является одновременное использование методов как РНК-анализа на образцах биоматериала пациентов, так и экспрессионной системы минигенов.
Для исследования вариантов сплайсинга создаваемые системы минигенов должны корректно воспроизводить сплайсинг референсных транскриптов. Для этого необходимо применять различные подходы по улучшению распознавания клонированных экзонов.
Разработанные системы минигенов являются удобной и эффективной моделью для тестирования терапевтических подходов, таких как антисмысловые технологии для коррекции сплайсинга.
Глава 4. Разработка и применение экспериментальных подходов для исследования патогенности регуляторных вариантов нуклеотидной последовательности
Некодирующие варианты нуклеотидной последовательности, расположенные в 5'UTR или в 3'UTR генов (и т.п.), могут являться регуляторными, и влиять как на транскрипцию, так и на трансляцию. Для их функционального исследования эффективным подходом является использование экспрессионных векторов с люциферазным репортерным геном.
Для разработки люциферазных систем нами проведена модификация вектора р8ЮИБСК-2, который содержит два гена люциферазы: репортерный (ИШис) и для нормализации (Ыис+). Такой подход устраняет необходимость совместной трансфекции двух плазмид, что, по нашему мнению, технически более удобно и обеспечивает более точную нормализацию активности репортерной люциферазы.
Для исследования патогенности регуляторных вариантов нуклеотидной последовательности была разработана схема комплексного функционального анализа (рисунок 22).
Рисунок 22 - Схема функционального анализа для исследования патогенности регуляторных
вариантов нуклеотидной последовательности
4.1 Использование люциферазной системы для проведения функционального анализа
5,UTR вариантов
В 5'UTR в гене РАХ6 у пациентов с врождённой аниридией описаны варианты (в том числе и патогенные), для которых не известен молекулярный механизм этиопатогенеза (рисунок 23А). Для функционального анализа данных вариантов разработана люциферазная система, в которой заклонирована вся 5'UTR гена РАХ6. Проведённые эксперименты показали, что самым главным эффектом, которым обладают
все варианты, является снижение эффективности трансляции основной открытой рамки считывания (рисунок 23Б-Б) [25].
Рисунок 23 - Варианты в 5'UTR гена PAX6 приводят к снижению эффективности трансляции CDS [25]. А. Схематическое изображение PAX6 5'UTR, показывающее варианты, описанные у пациентов с врожденной аниридией или аномалиями радужной оболочки. В. Анализ ОТ-ПЦР РНК из клеток HEK293T, трансфицированных контрольным вектором pGL3, содержащим полноразмерный 5'UTR PAX6. С. Результаты люциферазного теста для исследуемых вариантов. D. Результаты количественного ОТ-ПЦР для исследования экспрессии мРНК люциферазы
Биоинформатический анализ, а также проведённые дополнительные эксперименты показали, что в 5'UTR гена РЛХ6 находится малая открытая рамка считывания иОКР, которая кодирует пептид длиной в 8 аминокислот. Все патогенные варианты, найденные в 5'иТК гена РЛХ6 у пациентов с врождённой аниридией, приводят к нарушению структуры uORF, что вызывает снижение экспрессии основной рамки считывания РЛХ6 (рисунок 24).
Рисунок 24 - Схематическое изображение изменений структуры 8аа-иОКР, вызванных различными группами вариантов в 5'иТЯ гена РЛХ6 [25]
Для поиска регуляторных вариантов в 5'UTR других генов проведена ручная аннотация точек инициации трансляции в 5'UTR генов из базы данных ОМ1М. В результате проаннотировано около 4,5 тысяч малых открытых рамок считывания [4]. Для экспериментальной характеристики найденных иОКР созданы люциферазные системы, содержащие 5'UTR исследуемых генов. В эти конструкции внесены как искусственно созданные варианты, так и описанные в литературе, способные, согласно предсказаниям "uORF_a:nnotator", нарушать структуру иОКР и приводить к снижению трансляции основной открытой рамки считывания.
Проведённые исследования подтвердили, что рассматриваемые варианты в 5'UTR генов НТТ, ТТЫ, ОЫ2, СОЬ2А1, ЕТЕБН действительно снижают трансляцию основной открытой рамки считывания (рисунок 25) [39]. Дополнительные эксперименты, включающие внесение замен в ATG-кодоне иОЯР, привели к увеличению экспрессии тОЯ^, что дополнительно подтверждает наличие найденных иОЯР в 5'UTR рассматриваемых генов.
Рисунок 25 - Влияние регуляторных вариантов в 5'UTR на трансляцию mORF [4]. А. Сценарии влияния различных вариантов на структуру иОЯР. В. Результаты люциферазного теста по исследованию регуляторных вариантов в 5'UTR генов НТТ, ТТЫ, ОЫ2, СОЬ2А1, ЕТЕБН
Другим примером использования люциферазных систем для проведения функционального анализа регуляторных вариантов является исследование случая анемии Даймонда-Блэкфана. При секвенировании экзома у пробанда обнаружен вариант с.-19+Ш>Т в первом донорном сайте сплайсинга в 5'UTR гена ЯР87. Анализ варианта показал, что он приводит к изменению сплайсинга, сопряженного с сильным снижением транскрипции (рисунок 26) [44].
Рисунок 26 - Экспериментальный анализ варианта c.-19+1G>T в гене RPS7 [4]. А. Анализ РНК методом ОТ-ПЦР, выделенной из клеток HEK293T, трансфицированных люциферазными плазмидами дикого типа и с исследуемым вариантом. Схемы полученных изоформ мРНК показаны справа. В. Анализ экспрессии активности люциферазы с помощью «Dual-luciferase reporter assay». C. Анализ экспрессии мРНК с помощью RT-qPCR в клетках HEK293T,
трансфицированных каждой конструкцией
Аналогичным исследованием является поиск и изучение варианта сайта сплайсинга в 5'иТК гена РОМС у пациентов с дефицитом проопиомеланокортина. У семи неродственных пациентов пермской татарской этнической группы наблюдались гипогликемия и чрезмерная прибавка в весе, низкий уровень адренокортикотропина и кортизола в плазме крови. Секвенирование экзома выявило у них общий гомозиготный вариант с.-71+Ш>Л в первом донорном сайте в 5'UTR гена РОМС (рисунок 27). Анализ варианта в разработанной люциферазной системе показал, что он не приводит к изменению сплайсинга, но вызывает сильное снижение экспрессии гена [38]. Интересно отметить, что молекулярный механизм данного эффекта до сих пор не изучен.
Рисунок 27 - Вариант POMC 5' UTR c.-71+1G>A влияет на экспрессию мРНК [38]. А. Результаты секвенирования ДНК гена POMC у пациента и его матери. В. Анализ химерного транскрипта POMC-hRluc с использованием ОТ-ПЦР в клетках HEK293T, трансфицированных плазмидами дикого типа (WT) и мутантными (Mut) (c.-71+1G>A). С. Схематическое изображение вектора, трансфицированного в клетки HEK293T; представлены праймеры, используемые для ОТ-ПЦР и количественного ПЦР-анализа (горизонтальные стрелки). D. Анализ экспрессии мРНК POMC-hRluc. E. Анализ люциферазной активности в клетках HEK293T, трансфицированных конструкциями WT и Mut.
4.2. Использование люциферазной системы для проведения функционального
анализа 3'UTR вариантов
Одним из распространённых механизмов регуляции экспрессии генов является РНК-интерференция. Главным участником данного механизма является RISC-комплекс, который образован микроРНК и белком аргонавтом (AGO). В норме RISC-комплекс связывается с матричной РНК (мРНК), что приводит к ингибированию трансляции с последующей возможной деградацией мРНК (рисунок 28). Существует ряд работ, где показана связь (дисрегуляции) экспрессии генов за счёт микроРНК с развитием онкологических заболеваний, нейродегенеративных болезней, сердечной недостаточности, аутоиммунных заболеваний и многих других [21].
Рисунок 28 - Механизмы действия микроРНК в норме и при патологии
С помощь разработанной веб-программы "exp-miBR Annotator" проведён поиск вариантов нуклеотидной последовательности человека, находящихся в регионах связывания микроРНК (exp-miBR) и описанных как патогенные варианты при наследственных заболеваниях [16]. Для этого из 429 тысяч вариантов, описанных как патогенные в С1тУаг для одного или нескольких фенотипов, выявлен 961 вариант в высоко-достоверных сайтах связывания микроРНК. Так как повреждение сайта связывания микроРНК должно было приводить к увеличению экспрессии гена, то вторым условием поиска было список из 280 генов, проявляющих онкогенные свойства.
Для экспериментальной проверки выбрано 4 варианта, расположенных в 3' нетранслируемых областях трёх генов. Для исследования каждого варианта разработана люциферазная система и проведены эксперименты по измерению люциферазной активности. Получены следующие результаты (рисунок 29):
• Динуклеотидный вариант c.*8685_*8686delinsGA в 3'UTR гена СВКб значимо увеличивает экспрессию гена по сравнению с нормальным вариантом. Известно, что повышенная активность CDK6 может привести к неконтролируемому клеточному делению, что является одной из характеристик опухолевых клеток.
• Внесение варианта ^121918680 расположенного в 3'UTR гена, кодирующего трансферрин, показало увеличение экспрессии конструкции с мутантным регионом гена ТЕ примерно в 1,58 раза. Известно, что аномальная регуляция обмена железа и экспрессии
генов, связанных с метаболизмом железа, может играть роль в развитии некоторых типов рака.
• Два варианта в 3'UTR гена TMEM107 приводят к увеличению уровня экспрессии конструкции с регионами гена до значения 1,24 для варианта ^75008470 и до значения 1,37 для варианта ^201787275. Такие варианты могут влиять на тяжесть заболеваний, ассоциированных с геном TMEM107.
Рисунок 29 - Схема внесенных вариантов и их локализация в сайте связывания с микроРНК для генов CDK6, TF, TMEM107. In vitro анализ влияния внесения вариантов в сайт связывания микроРНК на уровень экспрессии мРНК для генов CDK6, TF, TMEM107
Итоги четвёртой главы основного содержания работы:
Использование люциферазной системы является высоко информативным при тестировании регуляторных вариантов, влияющих как на транскрипцию, так и на трансляцию.
С помощью люциферазной системы исследована патогенность вариантов, расположенных в 5'UTR генов COL2A1 [39], ETFDH [39], GLI2 [39], HTT [39], LAT [39], MAPRE2 [39], MAST1 [39], PAX6 [25], PAX9 [39], POMC [38], RPS7 [44], SET [39], TTN [39], ZIC2 [39]. Установлено, что данные варианты приводят к нарушению эффективности трансляции за счёт разных молекулярных механизмов, таких как нарушение структуры uORF и снижение транскрипции, опосредованное нарушением сплайсинга первого экзона. Проведённый анализ позволил впервые исследовать патогенность 29 вариантов.
С использованием люциферазной системы исследована патогенность вариантов, расположенных в 3'UTR генов CDK6, TF, TMEM107. Проведённый анализ впервые позволил исследовать влияние четырёх вариантов на изменение экспрессии таргетных генов за счёт нарушения связывания микроРНК с мРНК.
Глава 5. Разработка и применение экспериментальных подходов для исследования патогенности белок-кодирующих вариантов нуклеотидной последовательности
5.1 Разработка экспериментальных подходов для исследования патогенности
белок-кодирующих вариантов на доступном биоматериале пациентов с
наследственными заболеваниями
Исследования функционирования белков на доступном биоматериале пациентов чаще всего фокусируются на анализе ферментативной активности или структуры белков. Подобные анализы очень информативны и, как правило, имеют высокую достоверность.
Так, например, у пациента с миопатией при секвенировании экзома выявлено два новых варианта в гене COL6A3: нонсенс вариант p.Glu2402Ter, приводящий к деградации мРНК от этого аллеля из-за NMD, и миссенс вариант p.Arg1660Cys, приводящий к замене в N-концевом домене. Для исследования патогенности миссенс варианта получены культуры первичных фибробластов от всех членов семьи.
Иммунофлуоресцентное окрашивание белка COL6A3 в культуре фибробластов пробанда выявило значительное нарушение формирования внеклеточной фракции зрелого белка с удержанием COL6A3 во внутриклеточной фракции, что приводит к аберрантной локализации в перинуклеарной области (рисунок 30) [6]. Такие изменения описаны у пациентов с тяжелыми формами мышечной дистрофии Ульриха.
С
—5
<ъ_
п о
D
о_
Рисунок 30 - Иммунофлуоресцентное окрашивание культур фибробластов [6]. Ядра окрашены DAPI (синим), COL6A3 окрашивается антителами, меченными FITC (зеленый), что позволяет дифференцировать внутриклеточную и внеклеточную фракции. Красными стрелками показано внутриклеточное накопление незрелых олигомерных мутантных белков COL6A3, в то время как белыми стрелками показаны внеклеточные волокна зрелого COL6A3 в матрице культуры
фибробластов. Масштаб: 50 мкм. Увеличение х200
При проведении исследования семейного случая болезни Ниманна-Пика типа С у пациентов был обнаружен комплексный аллель c.[2727C>T; 2793C>T] в гене NPC1. РНК-анализ вместе с анализом в системе минигенов показали аддитивный эффект частого полиморфизма и редкого синонимичного варианта влияния на прохождения сплайсинга, проявляющийся в укорочении 18 экзона на 74 п.н. (r.2722_2795del) и приводящий к сдвигу рамки считывания (p.Val908Tyrfs*32).
Чтобы подтвердить диагноз болезни Ниманна-Пика типа С, проведён тест на окрашивание филипином. После снижения уровня холестерина первичные культуры фибробластов обоих пациентов были обработаны средой, содержащей 10% FBS. Окрашивание филипином показало повышенное внутриклеточное накопление неэтерифицированного холестерина в перинуклеарных везикулах у обоих пациентов с меньшим количеством и размером и более низким общим уровнем флуоресценции по сравнению с клетками положительного контроля (U18666A) [30], что согласно классификации Ваньера и Латура является характерным маркёром данного состояния (рисунок 31).
Control Control ♦ 1 2ЬиМ U18666-A PI Р2
(5*7.4% positive) (95.4±1.1% positive) (45.915.2* positive) (48.814.3% positive)
Рисунок 31 - Окраска фибробластов здорового индивидуума и пациентов (Р1 и Р2)
филипином [30]
Таким образом, разработанные экспериментальные подходы как на уровне РНК, так и на уровне белка позволили изучить молекулярный механизм развития заболевания, связанный с комплексным аллелем, и подтвердить его патогенность.
5.2 Разработка экспериментальных подходов для исследования патогенности белок-кодирующих вариантов на основе in vitro систем
Большая часть мировых исследований патогенности белок-кодирующих вариантов осуществляется в различных системах in vitro. Основными этапами в таких исследованиях являются: клонирование белок-кодирующей части гена в экспрессионный вектор, трансфекция в подходящую клеточных культуру, последующий анализ. Разнообразие функций белков требует значительного времени и усилий для создания системы, которая была бы корректной и воспроизводимой. Однако такой подход часто оказывается единственно возможным для определения патогенности исследуемых вариантов нуклеотидной последовательности.
При полноэкзомном секвенировании у пациентов с аутосомно-рецессивным гипотрихозом был найден миссенс вариант c.712G>T (p.Val238Leu) в гене кератина I типа KRT25. Ранее этот ген не был ассоциирован с заболеваниями. Для доказательства патогенности кодирующая часть гена KRT25 клонирована в экспрессионный вектор. Полученные конструкции с и без миссенс варианта трансфицированы в клетки HaCaT. Проведённый вестерн-блот анализ клеточных лизатов не выявил влияния исследуемого миссенс варианта на количество экспрессируемого белка (рисунок 32). Экспрессионный анализ вместе с кератином II типа KRT5 показал, что вариант p.Val238Leu приводит разрушению гетеродимеров образуемых K25 и его партнером K5 [2].
Рисунок 32 - Влияние варианта p.Val238Leu в гене KRT25 на образование промежуточных кератиновых волокон в клетках HaCaT [2]. А. Результаты вестерн-блоттинга. В. Результаты иммунофлуоресцентного анализа экспериментов in vitro при гиперэкспрессии K25 дикого типа
и с исследуемым вариантом V238L
Другой пример использования экспрессионного анализа in vitro связан с исследованием миссенс варианта c.1556T>G (p.Leu519Arg) в гене PHACTR1 у пациента с мультифокальной эпилепсией с инфантильными спазмами и гипсаритмией. Данный вариант обнаружен при секвенировании экзома пациента. Ранее этот ген также не был ассоциирован с заболеваниями.
Из литературы было известно, что белок PHACTR1 может взаимодействовать с G-актином и с каталитической субъединицей PP1. Экспрессионный анализ in vitro показал, что вариант L519R снижает сродство белка PHACTR1 к G-актину и увеличивает его склонность к образованию комплексов с каталитической субъединицей PP1 (рисунок 33) [27]. Дополнительные эксперименты показали, что наблюдаемые эффекты связаны с измененной субклеточной локализацией белка PHACTR1 и повышенной способностью индуцировать перестройки цитоскелета.
Рисунок 33 - Эксперименты по функциональному анализу миссенс варианта p.Leu519Arg в гене PHACTR1 [27]. А. Измерение анизотропии флуоресценции при связывании G-актина с пептидами Phactrl. В. Phactrl L519R увеличивает связывание с PP1 in vitro. Клетки NIH3T3 трансфицировали экспрессирующими плазмидами, кодирующими меченные FLAG-метками дикого типа PHACTR1, PHACTR1 L519R или PHACTR1 RRx и HA-меченый PP1, и выдерживали в 0,3% сыворотке в течение 16 часов. Взаимодействие между PP1 и Phactr1 определяли с помощью иммунопреципитации HA-PP1.
Проведя анализ литературы и различных баз данных, мы выдвинули гипотезу о том, что PHACTR1 может взаимодействовать с калиевым каналом Slack. Известно, что патогенные варианты в Slack связаны со злокачественными мигрирующими парциальными приступами в младенчестве, сопровождающимися также судорогами и умственной отсталостью. Клиническая картина у таких пациентов оказалась во многом похожа на заболевание обследуемого пациента, что подтверждает гипотезу о том, что PHACTR1 и Slack являются участниками одном молекулярного пути (рисунок 34).
Рисунок 34 - Схема молекулярных взаимодействий белка PHACTR1 в норме и при наличии миссенс варианта рХеи519А^ [27]. А. Схема молекулярных взаимодействий PHACTR1 в норме. В. Влияние миссенс варианта рХеи519А^ на взаимодействия PHACTR1, приводящие к
возникновению мультифокальной эпилепсии
Итоги пятой главы основного содержания работы:
В случае исследования белок-кодирующих вариантов подходы, включающие анализ общих характеристик белка (количества, локализации) и его специализированной функции, являются информативными.
На образцах биоматериала пациента проведены эксперименты по исследованию патогенности белок-кодирующих вариантов в генах COL6A3 [6], DES [13], NPC1 [30], TBCE [50]. Анализ позволил впервые доказать патогенность пяти вариантов.
С использованием экспрессионного анализа in vitro проведены эксперименты по исследованию патогенности белок-кодирующих вариантов в генах DES [13], KRT25 [2], PHACTR1 [27], TBCE [50]. Анализ позволил впервые доказать патогенность шести вариантов.
Глава 6. Алгоритм функционального анализа для установления патогенности вариантов нуклеотидной последовательности
По результатам проведённой работы был разработан алгоритм функционального анализа для установления патогенности вариантов нуклеотидной последовательности (рисунок 35). Алгоритм отображает основные этапы и варианты принятия решения от биоинформатического анализа варианта до выбора корректной стратегии проведения экспериментов.
Рисунок 35 - Алгоритм функционального анализа для установления патогенности вариантов
нуклеотидной последовательности
Стоит также подчеркнуть, что функциональный анализ не всегда требуется для всех выявленных вариантов нуклеотидной последовательности [42], а для значительной части вариантов экспериментальная проверка становится крайне сложной задачей из-за специфической функции исследуемого гена или его тканеспецифической экспрессии [1]. В таких случаях часто используют более сложные системы, таких как органоиды или модельные животные, однако эти подходы требуют значительных временных и финансовых затрат.
Разработанный алгоритм предлагает эффективное решение, сочетающее в себе экономичность и точность. Он позволяет оптимизировать процесс анализа, минимизируя необходимость в дорогостоящих экспериментах за счёт предварительного биоинформатического скрининга и выбора наиболее релевантных вариантов для дальнейшего изучения. Это делает алгоритм универсальным инструментом для исследований в области медицинской генетики, способным значительно ускорить процесс идентификации патогенных вариантов и снизить затраты на их функциональную верификацию.
ЗАКЛЮЧЕНИЕ
Проведенное исследование представляет собой комплексный и многосторонний подход к анализу патогенности генетических вариантов нуклеотидной последовательности. Разработанные биоинформатические программы Bad-mut score, SpliceAI-reforged, uORF_annotator и Exp-MiBR позволяют эффективно предсказывать патогенность различных типов вариантов, что является важным шагом в направлении разработки более точных и быстрых методов анализа геномных данных.
Эксперименты, проведенные на биоматериале пациентов с наследственными заболеваниями, а также in vitro, позволили подтвердить патогенность множества вариантов в различных генах. Это открывает новые перспективы для диагностики и лечения генетических заболеваний, а также для проведения исследований по изучению молекулярных механизмов, лежащих в их основе. Данные исследования формируют целое новое направление в молекулярной генетике, фокусирующееся на систематическом анализе функционального воздействия генетических вариантов и их роли в развитии заболеваний.
Полученные результаты значительно расширяют наше понимание генетических основ заболеваний и позволяют более точно изучить молекулярные нарушения, приводящие к возникновению заболеваний. Они могут быть использованы в клинической практике для улучшения диагностики, прогнозирования и лечения генетически обусловленных заболеваний, а также в научных исследованиях для разработки новых методов терапии и профилактики. Полученные результаты могут служить основой для будущих исследований в области генетики и биомедицины, открывая путь к персонализированной медицине и созданию инновационных подходов к лечению.
ВЫВОДЫ
1. Показано, что комплексный биоинформатический анализ играет ключевую роль в определении стратегии функционального исследования вариантов нуклеотидной последовательности. Для него были разработаны и внедрены специализированные биоинформатические инструменты для предсказания значимости различных типов вариантов: миссенс-вариантов (Bad-mut score), вариантов, влияющих на сплайсинг (SpliceAI-reforged), а также регуляторных вариантов, расположенных в 5'UTR (uORF_annotator) и 3'UTR (Exp-MiBR).
2. В результате исследования разработаны и внедрены экспериментальные подходы для анализа структуры и экспрессии мРНК на нативных образцах пациентов с наследственными заболеваниями. Эти подходы продемонстрировали высокую эффективность при исследовании патогенности вариантов сплайсинга, локализованных как в интронных, так и в экзонных областях следующих генов: ARSB, ASCC1, C19orf12, CFTR, COL6A3, CTNS, EDA, EIF2S3, EXT1, EXT2, GAA, GLB1, HGD, KIAA1109, LIPA, LMNA, MICU1, MYH7, NPC1, PALB2, PTPN11, SNX14, SPART, TCF4, TBCE. В результате проведённого анализа впервые была исследована патогенность 34 вариантов нуклеотидной последовательности.
3. На примере генов CTNS, C19orf12, EIF2S3, EXT1, EXT2 и PALB2 продемонстрировано, что РНК-анализ может быть эффективно использован в диагностике наследственных заболеваний. С его помощью можно выявлять патогенные варианты, расположенные в экзонах, нарушения сплайсинга, а также аллельный дисбаланс транскриптов, обусловленный регуляторными вариантами.
4. Установлено, что для РНК-анализа, направленного на изучение остаточной экспрессии транскриптов «дикого» типа и характеристики механизма нонсенс-опосредованной деградации транскриптов (NMD), необходимо применять таргетное глубокое секвенирование для детального анализа структуры транскриптов.
5. В результате исследования были разработаны экспериментальные подходы для исследования патогенности вариантов сплайсинга, локализованных как в интронах, так и в экзонах, с использованием in vitro системы минигенов. Опробованы и успешно применены различные методические решения для анализа 193 вариантов сплайсинга в следующих генах: C19orf12, CFTR, CLCN1, COL2A1, EDA, GLB1, HGD, LIPA, LMNA, MPZ, MYBPC3, MYH7, NPC1, ORC6, PALB2, PAX6, PCCA, PCCB, SCN1A, SCN2A, SH3TC2, TCF4.
6. Показано, что создание систем для проведения функционального анализа позволяет разрабатывать подходы для терапии. Так, с использованием созданной системы минигенов успешно протестированы методы подавления включения трёх псевдоэкзонов гена SCN1A модифицированными антисмысловых ^-мяРНК.
7. В результате исследования разработаны экспериментальные подходы для исследования патогенности регуляторных вариантов, расположенных в 5'UTR и 3'UTR генов. Эти подходы были успешно применены для анализа 29 вариантов в 5'UTR генов
COL2A1, ETFDH, GLI2, HTT, LAT, MAPRE2, MAST1, PAX6, PAX9, POMC, RPS7, SET, TTN, ZIC2 и 4 вариантов в 3'UTR генов CDK6, TF, TMEM107.
8. Для исследования патогенности белок-кодирующих вариантов нуклеотидной последовательности в генах COL6A3, DES, KRT25, NPC1, PHACTR1 и TBCE были разработаны экспериментальные подходы, включающие анализ на биоматериале пациентов и экспрессионные исследования in vitro. В результате проведённого анализа впервые была изучена патогенность 4 и 5 вариантов соответственно.
9. На основании полученных результатов разработан алгоритм функционального анализа для установления патогенности вариантов нуклеотидной последовательности.
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ АВТОРОМ ПО ТЕМЕ
ДИССЕРТАЦИИ
1. Zemov N, Skoblov M, Baranova A, Boyarsky K. Mutations in gonadotropin-releasing hormone signaling pathway in two nIHH patients with successful pregnancy outcomes. Reprod Biol Endocrinol. 2016 Aug 20;14(1):48. doi: 10.1186/s12958-016-0183-8. (Web of Science, Scopus) Q1
2. Zernov NV, Skoblov MY, Marakhonov AV, Shimomura Y, Vasilyeva TA, Konovalov FA, Abrukova AV, Zinchenko RA. Autosomal Recessive Hypotrichosis with Woolly Hair Caused by a Mutation in the Keratin 25 Gene Expressed in Hair Follicles. J Invest Dermatol. 2016 Jun;136(6):1097-1105. doi: 10.1016/j.jid.2016.01.037. (Web of Science, Scopus) Q1
3. Табаков В.Ю., Зиновьева О.Е., Воскресенская О.Н., Скоблов М.Ю. Получение и исследование характеристик культуры миобластов человека in vitro для обеспечения технологий клеточной и генетической терапии патологических состояний скелетных мышц. Клеточные технологии в биологии и медицине. 2017 г., № 4, стр. 222-228. (Scopus) Q3
4. Korvigo I, Afanasyev A, Romashchenko N, Skoblov M. Generalising better: Applying deep learning to integrate deleteriousness prediction scores for whole-exome SNV studies. PLoS One. 2018 Mar 14;13(3):e0192829. doi: 10.1371/journal.pone.0192829. (Web of Science, Scopus) Q1
5. Korvigo I, Holmatov M, Zaikovskii A, Skoblov M. Putting hands to rest: efficient deep CNN-RNN architecture for chemical named entity recognition with no hand-crafted rules. J Cheminform. 2018 May 23;10(1):28. doi: 10.1186/s13321-018-0280-0. (Web of Science, Scopus) Q1
6. Marakhonov AV, Tabakov VY, Zernov NV, Dadali EL, Sharkova IV, Skoblov MY. Two novel COL6A3 mutations disrupt extracellular matrix formation and lead to myopathy from Ullrich congenital muscular dystrophy and Bethlem myopathy spectrum. Gene. 2018 Sep 25;672:165-171. doi: 10.1016/j.gene.2018.06.026. (Web of Science, Scopus) Q1
7. Sparber P, Marakhonov A, Filatova A, Sharkova I, Skoblov M. Novel case of neurodegeneration with brain iron accumulation 4 (NBIA4) caused by a pathogenic variant affecting splicing. Neurogenetics. 2018 Dec;19(4):257-260. doi: 10.1007/s10048-018-0558-4. (Web of Science, Scopus) Q2
8. Плотникова О.М., Скоблов М.Ю. Эффективность программ, предсказывающих микроРНК-мРНК взаимодействия. Молекулярная биология, 2018, том 52, №3, c. 543-554. (Web of Science, Scopus) Q3
9. Филатова А.Ю., Васильева Т.А., Скоблов М.Ю., Кадышев В.В., Воскресенская А.А., Марахонов А.В., Зинченко Р.А. Функциональное подтверждение патогенности варианта интронной последовательности гена PAX6. Медицинская генетика. 2018;17(4):42-46. https://doi.org/10.25557/2073-7998.2018.04.42-46 (RSCI)
10. Bychkov IO, Kamenets EA, Filatova AY, Skoblov MY, Mikhaylova SV, Strokova TV, Gundobina OS, Zakharova EY. The novel synonymous variant in LIPA gene affects splicing and causes lysosomal acid lipase deficiency. Mol Genet Metab. 2019 Jul;127(3):212-215. doi: 10.1016/j.ymgme.2019.06.005. (Web of Science, Scopus) Q1
11. Filatova A, Freire V, Lozier E, Konovalov F, Bessonova L, Iudina E, Gnetetskaya V, Kanivets I, Korostelev S, Skoblov M. Novel KIAA1109 variants affecting splicing in a Russian family with ALKURAYA-KUCINSKAS syndrome. Clin Genet. 2019 Mar;95(3):440-441. doi: 10.1111/cge.13472. (Web of Science, Scopus) Q1
12. Filatova AY, Vasilyeva TA, Marakhonov AV, Voskresenskaya AA, Zinchenko RA, Skoblov MY. Functional reassessment of PAX6 single nucleotide variants by in vitro splicing assay. Eur J Hum Genet. 2019 Mar;27(3):488-493. doi: 10.1038/s41431-018-0288-y. (Web of Science, Scopus) Q1
13. Marakhonov AV, Brodehl A, Myasnikov RP, Sparber PA, Kiseleva AV, Kulikova OV, Meshkov AN, Zharikova AA, Koretsky SN, Kharlap MS, Stanasiuk C, Mershina EA, Sinitsyn VE, Shevchenko AO, Mozheyko NP, Drapkina OM, Boytsov SA, Milting H, Skoblov MY. Noncompaction cardiomyopathy is caused by a novel in-frame desmin (DES) deletion mutation within the 1A coiled-coil rod segment leading to a severe filament assembly defect. Hum Mutat. 2019 Jun;40(6):734-741. doi: 10.1002/humu.23747. (Web of Science, Scopus) Q1
14. Milovidova TB, Schagina OA, Freire MV, Demina NA, Filatova AY, Skoblov MY, Stepanova AA, Chuhrova AL, Polyakov AV. X-linked hypohidrotic ectodermal dysplasia: clinical and molecular genetic analysis of a large Russian family with a synonymous p.Ser267= (c.801A>G) splice site mutation. J Eur Acad Dermatol Venereol. 2019 Dec;33(12):e468-e470. doi: 10.1111/jdv.15798. (Web of Science, Scopus) Q1
15. Papizh S, Serzhanova V, Filatova A, Skoblov M, Tabakov V, van den Heuvel L, Levtchenko E, Prikhodina L. CTNS mRNA molecular analysis revealed a novel mutation in a child with infantile nephropathic cystinosis: a case report. BMC Nephrol. 2019 Oct 31;20(1):400. doi: 10.1186/s12882-019-1589-2. (Web of Science, Scopus) Q2
16. Plotnikova O, Baranova A, Skoblov M. Comprehensive Analysis of Human microRNA-mRNA Interactome. Front Genet. 2019 Oct 8;10:933. doi: 10.3389/fgene.2019.00933. (Web of Science, Scopus) Q1
17. Surikova Y, Filatova A, Polyak M, Skoblov M, Zaklyazminskaya E. Common pathogenic mechanism in patients with dropped head syndrome caused by different mutations in the MYH7 gene. Gene. 2019 May 20;697:159-164. doi: 10.1016/j.gene.2019.02.011. (Web of Science, Scopus) Q1
18. Sparber P, Filatova A, Anisimova I, Markova T, Voinova V, Chuhrova A, Tabakov V, Skoblov M. Various haploinsufficiency mechanisms in Pitt-Hopkins syndrome. Eur J Med Genet. 2020 Dec;63(12):104088. doi: 10.1016/j.ejmg.2020.104088. (Web of Science, Scopus) Q2
19. Sparber P, Sharova M, Filatova A, Shchagina O, Ivanova E, Dadali E, Skoblov M. Recessive myotonia congenita caused by a homozygous splice site variant in CLCN1 gene: a case report. BMC Med Genet. 2020 Oct 22;21(Suppl 1):197. doi: 10.1186/s12881-020-01128-5. (Web of Science, Scopus) Q3
20. Viakhireva I, Musatova E, Bessonova L, Shcherbatyuk Y, Korobkov S, Zhikriveckaya S, Sofronova Y, Mironova I, Khmelkova D, Konovalov F, Baranova A, Pomerantseva E, Skoblov M. Novel intronic variant in PALB2 gene and effective prevention of Fanconi anemia in family. Fam Cancer. 2020 Jul;19(3):241-246. doi: 10.1007/s10689-020-00165-6. (Web of Science, Scopus) Q2
21. Плотникова О.М., Скоблов М.Ю. Роль микроРНК в патогенезе наследственных заболеваний. Медицинская генетика 2020; 19(9): 5-17. DOI: 10.25557/2073-7998.2020.09.5-17. (RSCI)
22. Bychkov I, Baydakova G, Filatova A, Migiaev O, Marakhonov A, Pechatnikova N, Pomerantseva E, Konovalov F, Ampleeva M, Kaimonov V, Skoblov M, Zakharova E. Complex Transposon Insertion as a Novel Cause of Pompe Disease. Int J Mol Sci. 2021 Oct 8;22(19):10887. doi: 10.3390/ijms221910887. (Web of Science, Scopus) Q1
23. Bychkov I, Galushkin A, Filatova A, Nekrasov A, Kurkina M, Baydakova G, Ilyushkina A, Skoblov M, Zakharova E. Functional Analysis of the PCCA and PCCB Gene Variants Predicted to Affect Splicing. Int J Mol Sci. 2021 Apr 16;22(8):4154. doi: 10.3390/ijms22084154. (Web of Science, Scopus) Q1
24. Bychkov I, Kamenets E, Kurkina M, Rychkov G, Ilyushkina A, Filatova A, Guseva
D, Baydakova G, Nekrasov A, Cheblokov A, Skoblov M, Zakharova E. Alkaptonuria in Russia: mutational spectrum and novel variants. Eur J Med Genet. 2021 Apr;64(4):104165. doi: 10.1016/j.ejmg.2021.104165. (Web of Science, Scopus) Q2
25. Filatova AY, Vasilyeva TA, Marakhonov AV, Sukhanova NV, Voskresenskaya AA, Zinchenko RA, Skoblov MY. Upstream ORF frameshift variants in the PAX6 5'UTR cause congenital aniridia. Hum Mutat. 2021 Aug;42(8):1053-1065. doi: 10.1002/humu.24248. (Web of Science, Scopus) Q1
26. Kondratyeva E, Bukharova T, Efremova A, Melyanovskaya Y, Bulatenko N, Davydenko K, Filatova A, Skoblov M, Krasovsky S, Petrova N, Polyakov A, Adyan T, Amelina
E, Shadrina V, Zhekaite E, Zodbinova A, Chernyak A, Zinchenko R, Kutsev S, Goldshtein D. Health Characteristics of Patients with Cystic Fibrosis whose Genotype Includes a Variant of the Nucleotide Sequence c.3140-16T>A and Functional Analysis of this Variant. Genes (Basel). 2021 May 28;12(6):837. doi: 10.3390/genes12060837. (Web of Science, Scopus) Q2
27. Marakhonov AV, Prechova M, Konovalov FA, Filatova AY, Zamkova MA, Kanivets IV, Solonichenko VG, Semenova NA, Zinchenko RA, Treisman R, Skoblov MY. Mutation in PHACTR1 associated with multifocal epilepsy with infantile spasms and hypsarrhythmia. Clin Genet. 2021 May;99(5):673-683. doi: 10.1111/cge.13926. (Web of Science, Scopus) Q1
28. Sparber P, Krylova T, Repina S, Demina N, Rudenskaya G, Sharkova I, Sharkov A, Kadyshev V, Kanivets I, Korostelev S, Pomerantseva E, Kaimonov V, Mikhailova S, Zakharova E, Skoblov M. Retrospective analysis of 17 patients with mitochondrial membrane protein-associated neurodegeneration diagnosed in Russia. Parkinsonism Relat Disord. 2021 Mar;84:98-104. doi: 10.1016/j.parkreldis.2021.02.002. (Web of Science, Scopus) Q1
29. Sparber P, Mikhaylova S, Galkina V, Itkis Y, Skoblov M. Case Report: Functional Investigation of an Undescribed Missense Variant Affecting Splicing in a Patient With Dravet
Syndrome. Front Neurol. 2021 Dec 6;12:761892. doi: 10.3389/fneur.2021.761892. (Web of Science, Scopus) Q1
30. Bychkov I, Filatova A, Perelman G, Proshlyakova T, Korotkova D, Klyushnikov S, Karpova M, Tabakov V, Baydakova G, Ilyushkina A, Skoblov M, Zakharova E. Additive effect of frequent polymorphism and rare synonymous variant alters splicing in twin patients with Niemann-Pick disease type C. Eur J Hum Genet. 2022 Jan;30(1):133-136. doi: 10.1038/s41431-021-00898-7. (Web of Science, Scopus) Q1
31. Bychkov I, Kuznetsova A, Baydakova G, Gorobets L, Kenis V, Dimitrieva A, Filatova A, Tabakov V, Skoblov M, Zakharova E. Processed pseudogene insertion in GLB1 causes Morquio B disease by altering intronic splicing regulatory landscape. NPJ Genom Med. 2022 Jul 26;7(1):44. doi: 10.1038/s41525-022-00315-y. Erratum in: NPJ Genom Med. 2022 Nov 14;7(1):66. doi: 10.1038/s41525-022-00337-6. (Web of Science, Scopus) Q1
32. Ivanova N, Serzhanova V, Demina N, Guseva D, Skoblov M. mRNA analysis revealed a novel pathogenic EIF2S3 variant causing MEHMO syndrome. Eur J Med Genet. 2022 Feb;65(2):104421. doi: 10.1016/j.ejmg.2022.104421. (Web of Science, Scopus) Q2
33. Nazarenko MS, Viakhireva IV, Skoblov MY, Soloveva EV, Sleptcov AA, Nazarenko LP. Meier-Gorlin Syndrome: Clinical Misdiagnosis, Genetic Testing and Functional Analysis of ORC6 Mutations and the Development of a Prenatal Test. Int J Mol Sci. 2022 Aug 17;23(16):9234. doi: 10.3390/ijms23169234. PMID: 36012502; PMCID: PMC9408996. (Web of Science, Scopus) Q1
34. Semenova N, Marakhonov A, Ampleeva M, Kurkina M, Baydakova G, Skoblov M, Taran N, Babak O, Shchukina E, Strokova T. Hyperammonemia in Russia Due to Carbonic Anhydrase VA Deficiency Caused by Homozygous Mutation p.Lys185Lys (c.555G>A) of the CA5A Gene. Int J Mol Sci. 2022 Nov 30;23(23):15026. doi: 10.3390/ijms232315026. (Web of Science, Scopus) Q1
35. Sharkov A, Sparber P, Stepanova A, Pyankov D, Korostelev S, Skoblov M. Case Report: Phenotype-Driven Diagnosis of Atypical Dravet-Like Syndrome Caused by a Novel Splicing Variant in the SCN2A Gene. Front Genet. 2022 May 31;13:888481. doi: 10.3389/fgene.2022.888481. (Web of Science, Scopus) Q2
36. Sharova M, Guseva D, Kurenkov A, Novoselova O, Murtazina A, Skoblov M. Congenital myopathy as a new phenotype caused by two undescribed variants in ASCC1 gene. Am J Med Genet A. 2022 Oct;188(10):3100-3105. doi: 10.1002/ajmg.a.62898. (Web of Science, Scopus) Q2
37. Sharova M, Skoblov M, Dadali E, Demina N, Shchagina O, Konovalov F, Ampleeva M, Sharkova I, Kutsev S. Case report: Unusual episodic myopathy in a patient with novel homozygous deletion of first coding exon of MICU1 gene. Front Neurol. 2022 Nov 8;13:1008937. doi: 10.3389/fneur.2022.1008937. (Web of Science, Scopus) Q2
38. Viakhireva I, Kalinchenko N, Vasilyev E, Chistousova GV, Filatova A, Marakhonov A, Rubtsov PM, Skoblov M, Tiulpakov A. A Founder Mutation in the POMC 5'-UTR Causes Proopiomelanocortin Deficiency Through Splicing-Mediated Decrease of mRNA. J Clin Endocrinol Metab. 2022 Aug 18;107(9):e3654-e3660. doi: 10.1210/clinem/dgac397. (Web of Science, Scopus) Q1
39. Filatova A, Reveguk I, Piatkova M, Bessonova D, Kuziakova O, Demakova V, Romanishin A, Fishman V, Imanmalik Y, Chekanov N, Skitchenko R, Barbitoff Y, Kardymon O, Skoblov M. Annotation of uORFs in the OMIM genes allows to reveal pathogenic variants in 5'UTRs. Nucleic Acids Res. 2023 Feb 22;51(3):1229-1244. doi: 10.1093/nar/gkac1247. (Web of Science, Scopus) Q1
40. Kondratyeva E, Melyanovskaya Y, Bulatenko N, Davydenko K, Filatova A, Efremova A, Skoblov M, Bukharova T, Sherman V, Voronkova A, Zhekaite E, Krasovskiy S, Amelina E, Petrova N, Polyakov A, Adyan T, Starinova M, Krasnova M, Vasilyev A, Makhnach
0, Zinchenko R, Kutsev S, Gokdemir Y, Karadag B, Goldshtein D. Clinical and Functional Characteristics of the E92K CFTR Gene Variant in the Russian and Turkish Population of People with Cystic Fibrosis. Int J Mol Sci. 2023 Mar 28;24(7):6351. doi: 10.3390/ijms24076351. (Web of Science, Scopus) Q1
41. Levchenko O, Filatova A, Mishina I, Antonenko A, Skoblov M. Homozygous deep intronic variant in SNX14 cause autosomal recessive Spinocerebellar ataxia 20: a case report. Front Genet. 2023 Jul 6;14:1197681. doi: 10.3389/fgene.2023.1197681. (Web of Science, Scopus) Q2
42. Merkuryeva E, Markova T, Tyurin A, Valeeva D, Kenis V, Sumina M, Sorokin I, Shchagina O, Skoblov M, Nefedova M, Khusainova R, Zakharova E, Dadali E, Kutsev S. Clinical and Genetic Characteristics of Calvarial Doughnut Lesions with Bone Fragility in Three Families with a Reccurent SGMS2 Gene Variant. Int J Mol Sci. 2023 Apr 28;24(9):8021. doi: 10.3390/ijms24098021. (Web of Science, Scopus) Q1
43. Shchagina O, Orlova M, Murtazina A, Filatova A, Skoblov M, Dadali E. Evaluation of Pathogenicity and Causativity of Variants in the MPZ and SH3TC2 Genes in a Family Case of Hereditary Peripheral Neuropathy. Int J Mol Sci. 2023 Jun 6;24(12):9786. doi: 10.3390/ijms24129786. (Web of Science, Scopus) Q1
44. Skorodumova LO, Davydenko KA, Filatova AY, Skoblov MY, Kulemin NA, Khadzhieva MB, Zakharova ES, Gordeeva VD, Smetanina NS, Fedyushkina IV, Anastasevich LA, Larin SS. Splice-site variant in the RPS7 5'-UTR leads to a decrease in the mRNA level and development of Diamond-Blackfan anemia. Clin Genet. 2023 Jan;103(1):93-96. doi: 10.1111/cge.14221. (Web of Science, Scopus) Q1
45. Sparber P, Bychkov I, Pyankov D, Skoblov M. Functional investigation of SCN1A deep-intronic variants activating poison exons inclusion. Hum Genet. 2023 Aug;142(8):1043-1053. doi: 10.1007/s00439-023-02564-y. (Web of Science, Scopus) Q1
46. Borovikov A, Galeeva N, Marakhonov A, Murtazina A, Kadnikova V, Davydenko K, Orlova A, Sparber P, Markova T, Orlova M, Osipova D, Nagornova T, Semenova N, Levchenko O, Filatova A, Sharova M, Vasiluev P, Kanivets I, Pyankov D, Sharkov A, Udalova V, Kenis V, Nikitina N, Sumina M, Zherdev K, Petel'guzov A, Chelpachenko O, Zubkov P, Dan
1, Snetkov A, Akinshina A, Buklemishev Y, Ryzhkova O, Tabakov V, Zakharova E, Korostelev S, Zinchenko R, Skoblov M, Polyakov A, Dadali E, Kutsev S, Shchagina O. The Missing Piece of the Puzzle: Unveiling the Role of PTPN11 Gene in Multiple Osteochondromas in a Large Cohort Study. Human Mutation, 2024, 8849348, 13 pages, doi: 10.1155/2024/8849348 (Web of Science, Scopus, K1) Q1
47. Borovikov A, Marakhonov A, Murtazina A, Davydenko K, Filatova A, Galeeva N, Kadnikova V, Ogorodova N, Gorodilova D, Kanivets I, Pyankov D, Zherdev K, Petel'guzov A, Zubkov P, Polyakov A, Shchagina O, Skoblov M. Cases report: Mosaic structural variants of the EXT1 gene in previously genetically unconfirmed multiple osteochondromas. Front Genet. 2024 Aug 13;15:1435493. doi: 10.3389/fgene.2024.1435493. (Web of Science, Scopus, К1) Q2
48. Rudenskaya GE, Guseva DM, Shatokhina OL, Kadnikova VA, Filatova AY, Skoblov MY, Ryzhkova OP. Entsefalopatiya s narusheniem razvitiya i epilepsiei, vyzvannaya mutatsiei gena ATP1A2 [Developmental and epileptic encephalopathy produced by the ATP1A2 mutation]. Zh Nevrol Psikhiatr Im S S Korsakova. 2024;124(6):133-138. Russian. doi: 10.17116/jnevro2024124061133. (Scopus, К1) Q4
49. Sparber P, Sharova M, Davydenko K, Pyankov D, Filatova A, Skoblov M. Deciphering the impact of coding and non-coding SCN1A gene variants on RNA splicing. Brain. 2024 Apr 4;147(4):1278-1293. doi: 10.1093/brain/awad383. (Web of Science, Scopus, К1) Q1
50. Sparber P, Ulas E, Filatova A, Tatarskiy E, Perelman G, Makretskaya N, Nagaeva E, Kareva M, Frolova E, Kalinchenko N, Tvorogova AV, Golyshev S, Burakov A, Tabakov V, Lozier E, Konovalov F, Voinova V, Tiulpakov A, Skoblov M. Out-of-frame translation rescues a loss-of-function variant in a novel TBCE phenotype. J Clin Endocrinol Metab. 2024 Dec 6:dgae839. doi: 10.1210/clinem/dgae839. (Web of Science, Scopus, К1) Q1
51. Viakhireva I, Bychkov I, Markova T, Shatokhina O, Karandasheva K, Udalova V, Bekhtereva Y, Ryzhkova O, Skoblov M. The molecular complexity of COL2A1 splicing variants and their significance in phenotype severity. Bone. 2024 Apr;181:117013. doi: 10.1016/j.bone.2024.117013. (Web of Science, Scopus, К1) Q1
52. Салахов Р.Р., Голубенко М.В., Скоблов М.Ю., Савченко Р., Валиахметов Н.Р., Павлюкова Е.Н., Назаренко М.С. Функциональный анализ новой мутации сплайсинга c.2067+2T>G в гене MYBPC3 при гипертрофической кардиомиопатии. Бюллетень сибирской медицины. 2024;23(2):183-189. https://doi.org/10.20538/1682-0363-2024-2-183-189 (Scopus, К1) Q4
53. Bychkov I, Filatova A, Baydakova G, Sikora N, Garifullina E, Bykova A, Tabakov V, Skretnev A, Skoblov M, Zakharova E. Functional Analysis of Complex Structural and Splice-Altering Variants in the ARSB Gene Towards the Personalized Antisense-Based Therapy for Mucopolysaccharidosis Type VI Patients. Human Mutation. 2025, Volume 2025, Article ID 2250030, https://doi.org/10.1155/humu/2250030 (Web of Science, Scopus, К1) Q1
54. Shchagina O, Gilazova L, Filatova A, Vafina Z, Murtazina A, Chigvintceva P, Kudryashova O, Polyakov A, Kutsev S, Bulakh M, Skoblov M. The Basis of Diversity in Laminopathy Phenotypes Caused by Variants in the Intron 8 Donor Splice Site of the LMNA Gene. Int. J. Mol. Sci. 2025, 26, 1015. https://doi.org/10.3390/ijms26031015 (Web of Science, Scopus, К1) Q1
БЛАГОДАРНОСТИ
Автор выражает благодарность всем коллегам и соавторам, принимавшим участие в проектах данной работы. Он также выражает искреннюю благодарность всем сотрудникам, аспирантам, ординаторам, стажёрам и студентам, работавшим в лаборатории функциональной геномики ФГБНУ «МГНЦ» в период с 2015 по 2025 годы, а также всем коллегам, в сотрудничестве с которыми была выполнена данная работа.
Отдельную благодарность выражает Андрею Марахонову и Александре Филатовой за их ценный вклад в становление исследований функционального анализа, благодаря которым данное направление нашло свое развитие в России.
Автор также выражает глубокую признательность своей семье за поддержку и терпение.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.