Высокопроизводительный хромато-масс-спектрометрический анализ смесей протеолитических пептидов тема диссертации и автореферата по ВАК РФ 01.04.17, кандидат наук Иванов, Марк Витальевич
- Специальность ВАК РФ01.04.17
- Количество страниц 104
Оглавление диссертации кандидат наук Иванов, Марк Витальевич
Оглавление
Введение
Глава 1. Литературный обзор
Глава 2. Физико-химические свойства протеолитических пептидов и их
использование в задачах количественного анализа протеомов
Глава 3. Многостадийные поиски белков в задачах количественного профилирования смесей для анализа белок-белковых взаимодействий и
идентификации точечных модификаций первичных последовательностей
Глава 4. Определение первичной структуры белковых последовательностей без
использования тандемной масс-спектрометрии
Глава 5. Исследование эффективности аффинного взаимодействия белка человеческого альбумина с антителами, иммобилизированными на поверхности
монолитной фазы
Основные результаты и выводы
Список сокращений
Список литературы
Рекомендованный список диссертаций по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Комплементарные физико-химические свойства пептидов и их использование в протеомных исследованиях2019 год, кандидат наук Лобас Анна Александровна
Количественное профилирование смесей белков в задачах хроматомасс-спектрометрического анализа клеточных протеомов2022 год, кандидат наук Бубис Юлия Александровна
Универсальная шкала хроматографических времен удерживания биомакромолекул в задачах "скорострельной" протеомики2011 год, кандидат физико-математических наук Придатченко, Марина Леонидовна
Влияние химической обработки остатков цистеина в белках на результаты протеогеномного анализа2020 год, кандидат наук Кузнецова Ксения Глебовна
Детекция низкопредставленных белков 18 хромосомы методами таргетной протеомики2023 год, кандидат наук Вавилов Никита Эдуардович
Введение диссертации (часть автореферата) на тему «Высокопроизводительный хромато-масс-спектрометрический анализ смесей протеолитических пептидов»
Введение
Актуальность темы исследования. Масс-спектрометрия в сочетании с жидкостной хроматографией за последнее десятилетие стала основным методом для идентификации и количественного анализа биомакромолекул, включая белки, пептиды и нуклеиновые кислоты. Если говорить о белках, то речь идет о сравнительно новой области исследований - протеомики, среди основных задач которой можно выделить поиск биомаркеров заболеваний, включая как диагностические, так и прогностические (например, в ответ на терапевтическое или физико-химическое воздействие на клетки организма) белковые маркеры, определение химических (как in vivo, так и in vitro) модификаций белков и идентификацию первичной структуры белка. Говоря о смесях белков, выделенных из клеток живых организмов, следует отметить высокий уровень сложности задачи количественного профилирования таких смесей, связанный с высоким диапазоном концентраций белков, достигающим 10 порядков, разнообразием химических модификаций аминокислотных остатков последовательностей белков, присутствием значительного количества различных форм первичных структур одних и тех же белков, образуемых в процессе мутации генома и различного рода альтернативного сплайсинга. Если добавить естественную гетерогенность белков, связанную с природным содержанием стабильных изотопов основных элементов, входящих в их химический состав, то в рамках одного эксперимента, речь идет о количественном профилировании смесей, содержащих несколько миллионов индивидуальных высокомолекулярных соединений. Сложность и масштаб решения этой задачи диктует необходимость разработки и практической реализации новых подходов: как к постановке хромато-масс-спектрометрического эксперимента, так и обработке массивов получаемых данных. В настоящее время основным подходом к анализу сложных смесей белков является метод так называемой «скорострельной протеомики» ("shotgun
proteomics") в его наиболее популярной реализации, основанной на принципе "снизу-вверх" ("bottom-up proteomics"). Данный подход базируется на сборке белковых последовательностей через хромато-масс-спектрометрический анализ продуктов их протеолитического гидролиза, которые представляют из себя набор из нескольких десятков или сотен небольших пептидов массой до 3 кДа для каждого из белков анализируемой смеси. Таким образом, с одной стороны, гетерогенность соединений смеси уменьшается за счет уменьшения размеров анализируемых веществ, с другой стороны, сложность смесей возрастает до сотен миллионов индивидуальных соединений, что делает безальтернативным использование хромато-масс-спектрометрии для их анализа. Если учесть, что сам анализ состоит из нескольких необходимых этапов, включая гидролиз первоначальной смеси белков для получения смеси протеолитических пептидов, разделение этой смеси методами жидкостной хроматографии на входе в источник ионизации масс-спектрометра, получение масс-спектров пептидов для каждого пика хроматографического элюирования, определение в этих спектрах (называемых масс-спектрами первого уровня) пиков, соответствующих протеолитическим пептидам, последовательное изолирование ионов этих пептидов с последующей диссоциацией и получением масс-спектров их фрагментации (называемых масс-спектрами второго уровня), и, наконец, обработка полученных данных, то становится понятным масштаб проблемы. Для анализа таких смесей, состоящих их сотен миллионов индивидуальных соединений, критически важными становятся решение таких задач, как скорость анализа, количество идентифицируемых компонент смесей (пептидов и собираемых на основе пептидных идентификаций белков), а также достоверность получаемых результатов. Последний вопрос является особенно актуальным в протеомных исследованиях, поскольку результаты количественного анализа белков используются для решения медико-биологических проблем, в том числе связанных с социально-значимыми заболеваниями человека.
Цели и задачи исследования. Целью данной диссертационной работы является исследование механизмов и специфичности белок-белковых взаимодействий на основе протеомного анализа биологических образцов с использованием новых и оптимизацией существующих способов идентификации и количественного анализа белков, полученных методами протеолитического гидролиза, высокоэффективной жидкостной хроматографии биомакромолекул и тандемной масс-спектрометрии. Конкретными задачами работы были:
• Разработка новых физико-химических подходов к высокопроизводительному анализу первичной структуры белков в сложных смесях, основанных на измерении масс-спектров протеолитических пептидов белков и их последующей идентификации без использования фрагментации.
• Оценка количества ложных идентификаций протеолитических пептидов в результатах хромато-масс-спектрометрического анализа сложных смесей белков, получаемых на основе комбинированных поисков точечных химических и геномных модификаций первичных структур белков.
• Создание и тестирование теоретических моделей для подтверждения достоверности идентификаций, основанных на физико-химических свойствах анализируемых соединений, включая белки и пептиды.
Научная новизна работы заключается в следующем:
• Представлена новая модель ранжирования идентификаций пептидов на основе их физико-химических свойств. Данная модель обладает большей эффективностью по сравнению с существующими альтернативными методами и позволяет осуществлять количественное профилирование
протеомных смесей в задачах исследования взаимодействий белков клеток с другими белками, органическими и неорганическими химическими соединениями с более высокой чувствительностью и специфично стью.
• Предложен универсальный подход к оценке уровня ложно-положительных идентификаций для многостадийных поисков идентификаций протеолитических пептидов белков протеомов живых организмов с точечными химическими и геномными модификациями первичной структуры в результатах хромато-масс-спектрометрического протеомного анализа и разработаны программно-аналитические ресурсы для его практической реализации.
• Развит новый метод прямой хромато-масс-спектрометрической идентификации первичной структуры белков клеточных протеомов и их количественного анализа без использования тандемной масс-спектрометрии на основе фрагментации биомолекул, позволяющий повысить скорость проведения анализа и точность измерения относительной концентрации белков, участвующих как во внутриклеточных взаимодействиях, так и в реакциях с органическими и неорганическими химическими соединениями и комплексами.
Теоретическая и практическая значимость работы заключается в повышении эффективности анализа белковых экстрактов клеток методами хромато-масс-спектрометрии, а также в реализации возможности контроля над уровнем ложных идентификаций в результатах такого анализа.
Методы исследования. В диссертационной работе использовалась масс-спектрометрия на основе масс-анализаторов высокого разрешения в
комбинации с высокоэффективной обращено-фазовой жидкостной хроматографией. Для обработки экспериментальных данных, включая статистический анализ, использовалось разработанное диссертантом программное обеспечение на языке программирования Python (версия 2).
Положения, выносимые на защиту. На защиту выносятся:
• Подход к оценке достоверности идентификаций протеолитических пептидов в рамках протеомного анализа гидролизатов сложных смесей белков методами хромато-масс-спектрометрии, включая тандемную масс-спектрометрию, основанный на комплементарном использовании физико-химических свойств пептидов.
• Теоретическая модель для оценки уровня ложных идентификаций в результатах хромато-масс-спектрометрического анализа протеомов с использованием многостадийных поисков протеолитических пептидов.
• Новый экспериментальный метод идентификации и анализа первичной структуры белков в сложных смесях на основе жидкостной обращено-фазовой хроматографии и масс-спектрометрии высокого и сверхвысокого разрешения без использования тандемной масс-спектрометрии.
Степень достоверности полученных результатов. Достоверность полученных результатов была подтверждена как литературными данными, так и проведением контрольных экспериментов по анализу стандартных смесей белков, включая гидролизаты клеточных линий известного содержания.
Апробация результатов. Результаты исследований, представленных в диссертации, докладывались и обсуждались на: 24th Conference on mass-spectrometry (г. Вена, Австрия, 2013); 6-ом Съезде Российского масс-спектрометрического общества ВМСО (г. Москва, Россия, 2013); 13th Human
Proteome World Congress (г. Мадрид, Испания, 2014); Конференции Российского биохимического общества Белки и пептиды (г. Новосибирск, Россия, 2015); Proteomic Forum (г. Берлин, Германия, 2015); 5-ом Конгрессе Российского биохимического общества и общества физиологов России (г. Сочи, Россия, 2016); Proteomic Forum (г. Потсдам, Германия, 2017); European Mass Spectrometry Conference (г. Саарбрюккен, Германия, 2018); 22nd International Mass Spectrometry Conference (г. Флоренция, Италия, 2018).
Публикации. По материалам диссертации опубликовано 6 печатных работ. Работ, опубликованных в рецензируемых научных изданиях, рекомендованных ВАК - 6.
Личный вклад автора. Автором предложена концепция прямой масс-спектрометрической идентификации первичной структуры белков в протеомных исследованиях для количественного профилирования сложных смесей белков и исследования эффективности и специфичности их взаимодействия с органическими, неорганическими и биоорганическими соединениями и комплексами, выполнены ее практическая реализация и тестирование. Была создана программно-аналитическая платформа общего доступа, интегрирующая предложенные подходы, а также выполнена их апробация в практике протеомных исследований в профильных отечественных и зарубежных научных организациях.
Объем и структура диссертации. Диссертация состоит из введения, пяти глав, формулировки основных результатов и выводов, списка сокращений и списка цитируемой литературы. Работа изложена на 104 страницах и содержит 20 рисунков, 13 таблиц и библиографию из 78 наименований.
Глава 1. Литературный обзор
Протеомика - наука, изучающая качественный и количественный состав белковых смесей, называемых протеомом. Термин протеом может применяться как к определенному организму (например, протеом человека), так и к определенному органу (протеом печени). Протеом сложен в изучении из-за ряда факторов, таких как непостоянность (изменение со временем), неоднородность (различия между клетками в одних и тех же органах и тканях), присутствие модификаций и т.п.
Главным методом исследования протеомов является масс-спектрометрия. Масс-спектрометр представляет собой прибор, который ионизирует молекулы и анализирует отношение масс к зарядам полученных ионов. Среди всех типов масс-спектрометров можно выделить секторные, время-пролетные, квадрупольные и масс-спектрометры с ионной ловушкой. Наиболее широко используемыми в настоящий момент в задачах полнопротеомного анализа белкового состава клеток являются масс- спектрометры с масс-анализатором на основе электростатической ионной ловушкой Орбитрэп. Основными преимуществами этих масс-анализаторов являются высокая разрешающая способность, обеспечивающая различение близких по массе ионов порядка 0.001 Да, высокая точность измерения масс, достигающая миллионных долей измеряемой массы иона, а также высокая скорость измерения спектров высокого разрешения, составляющая порядка 50-100 мс на один спектр. Анализироваться в масс-спектрометре могут как целые белки, так и их составляющие аминокислотной последовательности, называемые пептидами.
Одним из наиболее популярных способов масс-спектрометрического анализа сложных смесей белков является метод так называемой протеомики "снизу-вверх" (в англоязычной литературе bottom-up). Данный подход основан на анализе небольших пептидов размером до 3 кДа, полученных
протеолитическим гидролизом белков. Подобный анализ состоит из нескольких этапов, среди которых гидролиз белков, разделение полученной смеси протеолитических пептидов, как правило, методами высокоэффективной жидкостной хроматографии (ВЭЖХ), ионизация элюируемых пептидов в источнике ионизации при атмосферном давлении, измерение так называемых масс-спектров первого уровня протеолитических пептидов, на основе которых осуществляется последовательный отбор ионов-прекурсоров для изоляции и фрагментации, а также измерение масс-спектров их фрагментации (масс-спектры второго уровня). Полученные масс-спектры как первого, так и второго уровней обрабатываются специализированным программным обеспечением [15].
Для проведения гидролиза белков чаще всего используется трипсин -фермент, разрезающий белки после аминокислотных остатков аргинина или лизина (К) в последовательности. Трипсин обладает высокой специфичностью и эффективностью, поэтому получившийся набор пептидов редко содержит более чем один пропущенный участок гидролиза [6]. Длина большинства получающихся пептидов находится в диапазоне 6-14 аминокислотных остатков, или 300-2000 Да, что хорошо совместимо с рабочим диапазоном большинства масс-анализаторов. Благодаря вышеперечисленным особенностям, а также простотой практической реализации гидролиза, трипсин является стандартом в протеомике "снизу-вверх". В случае полнопротеомного анализа клеток осуществляется одновременный гидролиз десятков тысяч белков (по некоторым оценкам до 1 млн. [7]), поэтому сложность получаемой смеси протеолитических пептидов превышает возможности современных масс-анализаторов измерить одновременно их масс-спектры [8]. Для уменьшения сложности смесей используется разделение пептидов, наиболее популярным методом для которого является градиентная обращенно-фазовая высокоэффективная жидкостная хроматография [9-12]. Каждый пептид выходит из колонки в определенное время в зависимости от своей
гидрофобности. Конечно, более правильно говорить о выходе сразу большого количества пептидов в заданном временном интервале, определяемом скоростью работы масс-спектрометра на различных этапах анализа (получение масс-спектров первого уровня, последовательная изоляция и фрагментация пептидов, измеренных в масс-спектрах первого уровня, измерение масс-спектров второго уровня). Как правило, общее время разделения составляет 3060 минут при времени элюирования пептида порядка нескольких десятков секунд. Разделение позволяет уменьшить на 2-3 порядка сложность смеси пептидов на входе масс-спектрометра. Помимо ВЭЖХ, возможно дополнительное использование методов разделения, основанных на отличных от ВЭЖХ физико-химических принципах, таких как гель-электрофорез. Гель-электрофорез разделяет компоненты смеси по их подвижности в постоянном электрическом поле. При этом разные молекулы движутся с различными скоростями в зависимости от их зарядового состояния и массы. Чаще всего в протеомике гель-электрофорез применяют к белкам для их разделения на фракции до процесса гидролиза.
В качестве стандартного метода ионизации пептидов используется электроспрей [13]. Пептиды с растворителем на выходе из хроматографа проходят через металлическую иглу, к которой приложено напряжение в несколько кВ относительно электрода с входным отверстием в первые ступени откачки вакуумной системы. Как правило, входное отверстие представляет из себя нагреваемый капилляр. Поток заряженных капель растворителя, образующийся на выходе из электрораспылительной иглы, с находящимися в них молекулами анализируемых веществ попадает в этот капилляр за счет газодинамического потока. По пути через капилляр в систему транспорта ионов масс-спектрометра капли многократно распадаются на более мелкие вплоть до образования отдельных ионов пептидов. В случае положительных ионов основным механизмом ионизации является протонирование молекул пептидов, для чего рН растворов, поступающих в источник ионизации, поддерживается в
диапазоне 2.0-2.4 путем добавления кислот. Как правило, в электроспрее используется муравьиная кислота, либо смесь муравьиной и трифторуксусной кислот (последняя плохо совместима с ионизацией в положительной моде, но добавляется для повышения эффективности обращено-фазового ВЭЖХ разделения).
Для поступивших в масс-спектрометр ионов пептидов сначала снимаются масс-спектры первого уровня. Они представляют собой наборы точек со значениями отношения масс к зарядам ионов и их относительных интенсивностей. Интенсивности пиков ионов пептидов в масс-спектрах пропорциональны количеству ионов той или иной массы. При этом масс-спектры первого уровня обычно измеряются диапазоне отношений массы к заряду (m/z) 300 а.е. и выше, чтобы отсечь шумовые ионы примесей, не относящихся к анализируемым смесям. Специальное программное обеспечение масс-спектрометра анализирует спектры первого уровня в режиме реального времени, распознавая в первую очередь масс-спектры изотопных (по изотопу 13С) кластеров пептидов. Они представляют набор пиков, сдвинутых между собой на определенное расстояние. Самый большой вклад в изотопный кластер вносят атомы углерода. Масса моноизотопного углерода равна 12 а.е.м., а его наиболее распространенного изотопа 13.0033 а.е.м., причем содержание последнего в природе составляет 1%. Известно, что в среднем в одной аминокислоте содержится 5 атомов углерода. Используя биномиальное распределение, можно оценить распределение молекул по изотопам для пептида длиной 10. В данном случае 60% молекул будут состоять только из моноизотопных углеродов, 30% будут иметь один изотопный углерод и т.д. Для пептида с зарядовым состоянием +1 расстояние между изотопными пиками будет равно 1.0033 а.е., с зарядовым состоянием +2, соответственно, 0.50016 а.е. и т.д. Программное обеспечение прибора находит такие наборы пиков, которые подходят под изотопное распределение пептидов (так называемые пептидно-подобные кластеры в масс-спектрах) и сортирует их по интенсивности.
^3 Уз ^3 Vi Vi
R1
H2N —C-
H
О R2 О R3 О
II гС^ rN- 1 гС^ II гС^ rNn 1 гС^ II гС^ rN-r
Н Н н н Н ;
R4 I
-C-COOH H
a-i b1 c^ a2 b2 c2 a3 b3 c3 Рисунок 1. Общая схема образования фрагментов
Наиболее интенсивные пики изолируются и поступают в камеру ионной ловушки, в которой осуществляется их фрагментация. Там они диссоциируют в столкновениях с молекулами буферного газа (либо азот, либо гелий) до небольших фрагментов, для которых прибор записывает значения интенсивностей и отношений m/z. Типы фрагментов, получаемых различными методами тандемной масс-спектрометрии и регистрируемые в спектрах МС/МС (масс спектр фрагментов), определяются рядом факторов, таких как аминокислотная последовательность, энергия активации внутренних степеней свободы родительских ионов, способы, которыми эта энергия была получена, зарядовое состояние и т. д. Если заряд сосредоточен на амидном N-конце аминокислотной последовательности иона фрагмента пептида, то такие ионы классифицируются как тип a, b или с, а если на C-конце, то серии ионов фрагментов будут — x, y и z [14, 15]. Более подробно классификация фрагментов пептидов представлена схематически на Рис. 1. Помимо разрыва пептидных связей в процессе диссоциации пептидов возможны потери различных химических групп, которые увеличивают разнообразие возможных ионов фрагментов. Некоторые из этих фрагментов представлены в Таблице 1.
Таблица 1. Типы фрагментов пептидов.
Тип фрагмента Молекулярная масса
а [N1 + [М] - СНО
а* а - КН3
а° а - Н20
Ь [N1 + [М] - Н
Ь* Ь - МН3
Ь° Ь - Н20
с [N1 + [М] + КН2
d а - частичная потеря боковой цепи
V у - потеря боковой цепи
Ы ъ - частичная потеря боковой цепи
X [С]+[М]+СО-Н
у [С]+[М]+Н
у* у-КН3
у° у-Н20
ъ [С]+[М]-КН2
Следует также отметить, что при использовании различных методов фрагментации пептидов получаемые типы ионов фрагментов также могут быть различными:
• Столкновительная диссоциация. Тип диссоциации, при которой молекулярные ионы пептидов разгоняются приложением электрического поля в среде нейтрального газа, в роли которого чаще всего выступает аргон, гелий или азот. При столкновениях с нейтральными молекулами кинетическая энергия ионов пептидов переходит во внутреннюю, что приводит к разрыву аминокислотных связей и пептиды распадаются на небольшие фрагменты. При диссоциации, реализуемой в столкновениях ионов низкой энергии, наблюдаются в основном ионы типа Ь и у. Кроме того, для пептидов, содержащих аминокислотные остатки R, К, N и Q, могут наблюдаться а*, Ь* и у* ионы. Для пептидов, содержащих в
последовательности аминокислотные остатки S, Т, Е и D, могут наблюдаться а°, Ь° и у° ионы.
• Высокоэнергетичная столкновительная диссоциация. Данный тип диссоциации отличается от столкновительной диссоциации силой электрического поля, прикладываемой к ионам пептидов. Но из-за отличий в образуемых фрагментах пептидов принято выделять данный тип диссоциации как отдельный метод. При данном методе фрагментации возможны все типы фрагментов, за исключением фрагментов с потерями воды или аммония.
• Диссоциативный захват медленных электронов. В данном методе заряженные ионы пептидов взаимодействуют с электронами низкой энергии (менее 4 эВ). Энергия рекомбинации, идущей по резонансному механизму, идет на разрыв пептидных связей в последовательности с образованием фрагментов серий с, у и ъ. В некоторых случаях возможны ш ионы [16].
Поскольку процесс диссоциации при захвате медленных электронов не связан с возбуждением колебательных степеней свободы в молекулах пептидов, разрыв связей происходит за времена порядка 10-13 с [17-19]. При использовании этого метода сохраняются слабосвязанные с боковыми цепями аминокислотных остатков химические группы (например фосфогруппа), что позволяет идентифицировать пострансляционные модификации анализируемых пептидов и белков. Напротив, в случае столкновительной диссоциации информация о таких модификациях теряется [20-22].
Таким образом, масс-спектрометр выдает экспериментальную информацию, которая содержит массы и интенсивности ионов пептидов, их время выхода из хроматографической колонки, а также спектры фрагментации изолированных ионов. Обработка данных, в свою очередь, также состоит из множества этапов, среди которых основными являются поиск подходящих по
массам пептидов кандидатов из теоретической базы белков, составление списка идентифицированных белков из списка найденных пептидов, а также оценка уровня достоверности полученных результатов. Информация, полученная из поиска по базе белков, зависит от природы анализируемых пептидов, экспериментальных условий работы масс-спектрометра и выбранных параметров работы поискового алгоритма, который осуществляет сопоставление экспериментальных и теоретических масс-спектров, так называемая поисковая протеомная машина (ППМ) [23-25]. В настоящее время было разработано несколько ППМ, которые используются в практике протеомных исследований, среди которых есть как машины открытого доступа [26-31], так и коммерческие продукты [1, 32, 33]. Основной задачей поискового алгоритма является сравнение измеренной массы родительских ионов и соответствующих им масс-спектров фрагментации с теоретическими, полученными расчетом масс-спектров диссоциации для пептидов-кандидатов из базы данных белков.
Базы данных белков составлены на основе результатов геномного секвенирования образцов [34]. Стоит заметить, что не для всех организмов получено геномное секвенирование и, как следствие, для таких организмов отсутствуют данные о последовательностях белков. В этом случае возможны альтернативные методы протеомного анализа, основанные на подходах de novo секвенирования [35-37], в которых «сборка» потенциальных пептидных последовательностей осуществляется непосредственно по спектрам фрагментации. В случае же традиционных поисков по известным базам данных составляется список последовательностей белков, которые потенциально могут присутствовать в образце. Пептиды-кандидаты подбираются в пределах некоторой точности определения масс ионов, зависящей от используемого типа масс-анализатора. Поисковый алгоритм присваивает пептидам индекс достоверности, основанный на точности совпадения реальных и теоретических спектров фрагментации. В дальнейшем он используется для разделения
правильных и ложных идентификаций. Большинство индексов достоверности представляют собой вероятностные значения, такие как «p-value» или «e-value». Однако эти индексы сильно зависят от экспериментальных условий и невозможно подобрать для них универсальное пороговое значение, при котором уровень ложно-положительных идентификаций (FDR) был бы фиксирован.
FDR представляет собой долю ложных идентификаций (спектров, пептидов или белков), проходящих через пороговое значение. В типичных протеомных экспериментах уровень FDR стремятся приблизить к значению 1%. Наиболее распространенным методом оценки FDR является стратегия с использованием ложной базы данных [38, 39]. В этом подходе к базе данных существующих белков («таргетная» база) добавляются ложные последовательности («декойная» база) с обратным порядком чередования аминокислотных остатков или последовательности со случайным образом перемешанными аминокислотными остатками. При этом полученная «декойная» база будет содержать пептиды со схожими распределениями физико-химических свойств, таких как масса, хроматографические времена удерживания, длина пептидов и т.д. Ожидается, что количество ложных идентификаций пептидов будет распределено равномерно между «таргетной» и «декойной» базами. На основе этого можно легко рассчитать долю ложных идентификаций для любого порогового значения индекса достоверности путем подсчета числа пептидов из «декойной» базы, прошедших порог.
Похожие диссертационные работы по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Создание и применение методов количественной протеомики с использованием и без использования изотопного мечения2011 год, кандидат физико-математических наук Агрон, Илья Александрович
Совершенствование протеомного метода для качественного определения белкового состава мяса и мясных продуктов2021 год, кандидат наук Ахремко Анастасия Геннадьевна
Анализ фотодинамики белковых комплексов тилакоидных мембран при помощи масс-спектрометрии высокого разрешения2011 год, кандидат химических наук Галецкий, Дмитрий Николаевич
Анализ масс-спектров пептидных фрагментов для идентификации генетически детерминированного полиморфизма белков2012 год, кандидат биологических наук Чернобровкин, Алексей Леонидович
Метод распознавания аминокислотных последовательностей в масс-спектрах пептидов для задач протеомики2007 год, кандидат технических наук Лютвинский, Ярослав Игоревич
Список литературы диссертационного исследования кандидат наук Иванов, Марк Витальевич, 2018 год
Список литературы
1. Eng J.K., McCormack A.L., Yates J.R. An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database // Journal of the American Society for Mass Spectrometry. — 1994. — V. 5. — N. 11. — P. 976-989.
2. Yates J.R., Ruse C.I., Nakorchevsky A. Proteomics by mass spectrometry: approaches advances and applications // Annual Review of Biomedical Engineering. — 2009. — V. 11. — P. 49-79.
3. Zhang Z., Wu S., Stenoien D.L., Pasa-Tolic L. High-throughput proteomics // Annual Review of Analytical Chemistry.— 2014. — V. 7. — P.427-454.
4. Yates J.R. The Revolution and Evolution of Shotgun Proteomics for Large-Scale Proteome Analysis // Journal of the American Chemical Society. — 2013. — V. 135. — N. 5. — P. 1629-1640.
5. Cox J., Mann M. Quantitative high-resolution proteomics for data-driven systems biology // Annual Review of Biochemistry. — 2011. — V. 80. — P. 273-299.
6. Tsiatsiani L., Heck A.J.R. Proteomics beyond trypsin // The Federation of European Biochemical Societies Journal. — 2015. — V. 282. — N. 14. — P. 2612-2626.
7. Milo R. What is the total number of protein molecules per cell volume? A call to rethink some published values // Bioessays. — 2013. — V. 35. — N. 12. — P. 1050-1055.
8. Michalski A., Cox J., Mann M. More than 100000 detectable peptide species elute in single shotgun proteomics runs but the majority is inaccessible to data-dependent LC-MS/MS // Journal of Proteome Research. — 2011. — V. 10. — N. 4. — P. 1785-1793.
9. Hosp F., Scheltema R.A., Eberl H.C., Kulak N.A., Keilhauer E.C., Mayr K., Mann M. A Double-Barrel Liquid Chromatography-Tandem Mass Spectrometry (LC-MS/MS) System to Quantify 96 Interactomes per Day // Molecular and Cellular Proteomics. — 2015. — V. 14. — N. 7. - P. 20302041.
10.Karpievitch Y.V., Polpitiya A.D., Anderson G.A., Smith R.D., Dabney A.R. Liquid Chromatography Mass Spectrometry-Based Proteomics: Biological and Technological Aspects // The Annals of Applied Statistics. — 2010. — V. 4. — N. 4. — P. 1797-1823.
11.Shen Y., Zhao R., Berger S.J., Anderson G.A., Rodriguez N., Smith R.D. High-Efficiency Nanoscale Liquid Chromatography Coupled On-Line with Mass Spectrometry Using Nanoelectrospray Ionization for Proteomics // Analytical Chemistry. — 2002. — V. 74. — N. 16. — P. 4235-4249.
12.Shi Y., Xiang R., Horvath C., Wilkins J.A. The role of liquid chromatography in proteomics // Journal of Chromatography A. — 2004. — V. 1053. — N. 1. — P. 27-36.
13.Fenn J.B., Mann M., Meng C.K., Wong S.F., Whitehouse C.M. Electrospray ionization for mass spectrometry of large biomolecules // Science. — 1989. — V. 246. — N. 4926. — P. 64-71.
14.Roepstorff P., Fohlman J. Proposal for a common nomenclature for sequence ions in mass spectra of peptides // Biomedical Mass Spectrometry. — 1984. — V. 11. — N. 11. — P. 601.
15.Johnson R.S., Martin S.A., Biemann K., Stults J.T., Watson J.T. Novel fragmentation process of peptides by collision-induced decomposition in a tandem mass spectrometer: differentiation of leucine and isoleucine // Analytical Chemistry. — 1987. — V. 59. — N. 21. — P. 2621-2625.
16.Zubarev R.A. Electron-capture dissociation tandem mass spectrometry // Current Opinion in Biotechnology. — 2004. — V. 15. — N. 1. — P. 12-16.
17.Wysocki V.H., Tsaprailis G., Smith L.L., Breci L.A. Mobile and localized protons: a framework for understanding peptide dissociation // Journal of Mass Spectrometry. — 2000. — V. 35. — N. 12. — P. 1399-1406.
18.Dodds E.D., Hagerman P.J., Lebrilla C.B. Fragmentation of singly protonated peptides via a combination of infrared and collisional activation // Analytical Chemistry. — 2006. — V. 78. — N. 24. — P. 8506-8511.
19.Paizs B., Suhai S. Fragmentation pathways of protonated peptides // Mass Spectrometry Reviews. — 2005. — V. 24. — N. 4. — P. 508-548.
20.Kandasamy K., Pandey A., Molina H. Evaluation of several MS/MS search algorithms for analysis of spectra derived from electron transfer dissociation experiments // Analytical Chemistry. — 2009. — V. 81. — N. 17. — P. 71707180.
21.Sweet S.M.M., Bailey C.M., Cunningham D.L., Heath J.K., Cooper H.J. Large scale localization of protein phosphorylation by use of electron capture dissociation mass spectrometry // Molecular and Cellular Proteomics. — 2009. — V. 8. — N. 5. — P. 904-912.
22.Sweet S.M.M., Jones A.W., Cunningham D.L., Heath J.K., Creese A.J., Cooper H.J. Database search strategies for proteomic data sets generated by electron capture dissociation mass spectrometry // Journal of Proteome Research. — 2009. — V. 8. — N. 12. — P. 5475-5484.
23.Huang Y., Triscari J.M., Tseng G.C., Pasa-Tolic L., Lipton M.S., Smith R.D., Wysocki V.H. Statistical characterization of the charge state and residue dependence of low-energy CID peptide dissociation patterns // Analytical Chemistry. — 2005. — V. 77. — N. 18. — P. 5800-5813.
24.Swaney D.L., McAlister G.C., Coon J.J. Decision tree-driven tandem mass spectrometry for shotgun proteomics // Nature Methods. — 2008. — V. 5. — N. 11. — P. 959-964.
25.Zhang Y., Fonslow B.R., Shan B., Baek M.-C., Yates J.R. Protein analysis by shotgun/bottom-up proteomics // Chemical Reviews. — 2013. — V. 113. — N. 4. — P. 2343-2394.
26.Craig R., Beavis R.C. TANDEM: matching proteins with tandem mass spectra // Bioinformatics. — 2004. — V. 20. — N. 9. — P. 1466-1467.
27.Geer L.Y., Markey S.P., Kowalak J.A., Wagner L., Xu M., Maynard D.M., Yang X., Shi W., Bryant S.H. Open mass spectrometry search algorithm // Journal of Proteome Research. — 2004. — V. 3. — N. 5. — P. 958-964.
28.Dorfer V., Pichler P., Stranzl T., Stadlmann J., Taus T., Winkler S., Mechtler K. MS Amanda a universal identification algorithm optimized for high accuracy tandem mass spectra // Journal of Proteome Research. — 2014. — V. 13. — N. 8. — P. 3679-3684.
29.Cox J., Neuhauser N., Michalski A., Scheltema R.A., Olsen J.V., Mann M. Andromeda: a peptide search engine integrated into the MaxQuant environment // Journal of Proteome Research. — 2011. — V. 10. — N. 4. — P. 1794-1805.
30.Wenger C.D., Coon J.J. A proteomics search algorithm specifically designed for high-resolution tandem mass spectra // Journal of Proteome Research. — 2013. — V. 12. — N. 3. — P. 1377-1386.
31.Kim S., Pevzner P.A. MS-GF+ makes progress towards a universal database search tool for proteomics // Nature Communications. — 2014. — V. 5. — P. 5277.
32.Perkins D.N., Pappin D.J., Creasy D.M., Cottrell J.S. Probability-based protein identification by searching sequence databases using mass spectrometry data // Electrophoresis. — 1999. — V. 20. — N. 18. — P. 3551-3567.
33.Zhang J., Xin L., Shan B., Chen W., Xie M., Yuen D., Zhang W., Zhang Z., Lajoie G.A., Ma B. PEAKS DB: de novo sequencing assisted database search for sensitive and accurate peptide identification // Molecular and Cellular Proteomics. — 2012. — V. 11. — N. 4. — P. M111.010587.
34.Dunham I., Shimizu N., Roe B.A., Chissoe S., Hunt A.R., Collins J.E., Bruskiewich R., Beare D.M., Clamp M., Smink L.J., Ainscough R., Almeida J.P., Babbage A., Bagguley C., Bailey J., Barlow K., Bates K.N., Beasley O., Bird C.P., Blakey S., Bridgeman A.M., Buck D., Burgess J., Burrill W.D., O'Brien K.P. The DNA sequence of human chromosome 22 // Nature. — 1999. — V. 402. — N. 6761. — P. 489-495.
35.Allmer J. Algorithms for the de novo sequencing of peptides from tandem mass spectra // Expert Review of Proteomics. — 2011. — V. 8. — N. 5. — P. 645-657.
36.Hughes C., Ma B., Lajoie G.A. De novo sequencing methods in proteomics // Methods in Molecular Biology. — 2010. — V. 604. — P. 105-121.
37.Muth T., Renard B.Y. Evaluating de novo sequencing in proteomics: already an accurate alternative to database-driven peptide identification // Briefings in Bioinformatics. — 2017. — P. bbx033.
38.Elias J.E., Gygi S.P. Target-decoy search strategy for increased confidence in large-scale protein identifications by mass spectrometry // Nature Methods. — 2007. — V. 4. — N. 3. — P. 207-214.
39.Gupta N., Bandeira N., Keich U., Pevzner P.A. Target-decoy approach and false discovery rate: when things may go wrong // Journal of the American Society for Mass Spectrometry. — 2011. — V. 22. — N. 7. — P. 1111-1120.
40.Houel S., Abernathy R., Renganathan K., Meyer-Arendt K., Ahn N.G., Old W.M. Quantifying the impact of chimera MS/MS spectra on peptide identification in large-scale proteomics studies // Journal of Proteome Research. — 2010. — V. 9. — N. 8. — P. 4152-4160.
41.Kall L., Canterbury J.D., Weston J., Noble W.S., MacCoss M.J. Semi-supervised learning for peptide identification from shotgun proteomics datasets // Nature Methods. — 2007. — V. 4. — N. 11. — P. 923-925.
42.Keller A., Nesvizhskii A.I., Kolker E., Aebersold R. Empirical statistical model to estimate the accuracy of peptide identifications made by MS/MS and
database search // Analytical Chemistry. — 2002. — V. 74. — N. 20. — P. 5383-5392.
43.Alves G., Yu Y.-K. Improving Peptide Identification Sensitivity in Shotgun Proteomics by Stratification of Search Space // Journal of Proteome Research.
— 2013. — V. 12. — N. 6. — P. 2571-2581.
44.Shanmugam A.K., Nesvizhski A.I. Effective leveraging of targeted search spaces for improving peptide identification in MS/MS based proteomics // Journal of Proteome Research. — 2015. — V. 14. — N. 12. — P. 5169-5178.
45.Jeong K., Kim S., Bandeira N. False discovery rates in spectral identification // BioMed Central Bioinformatics. — 2012. — V. 13. — P. Suppl 16 S2
46.Nesvizhskii A.I. A survey of computational methods and error rate estimation procedures for peptide and protein identification in shotgun proteomics // Journal of Proteomics. — 2010. — V. 73. — N. 11. — P. 2092-2123.
47.Tharakan R., Edwards N., Graham D.R.M. Data maximization by multipass analysis of protein mass spectra // Proteomics. — 2010. — V. 10. — N. 6. — P. 1160-1171.
48.Cottrell J.S. Protein identification by peptide mass fingerprinting // Peptide Research. — 1994. — V. 7. — N. 3. — P. 115-124.
49.Gay S., Binz P.A., Hochstrasser D.F., Appel R.D. Modeling peptide mass fingerprinting data using the atomic composition of peptides // Electrophoresis.
— 1999. — V. 20. — N. 18. — P. 3527-3534.
50.James P., Quadroni M., Carafoli E., Gonnet G. Protein identification by mass profile fingerprinting // Biochemical and Biophysical Research Communications. — 1993. — V. 195. — N. 1. — P. 58-64.
51.Pappin D.J., Hojrup P., Bleasby A.J. Rapid identification of proteins by peptide-mass fingerprinting // Current Biology : CB. — 1993. — V. 3. — N. 6.
— P. 327-332.
52.Henzel W.J., Billeci T.M., Stults J.T., Wong S.C., Grimley C., Watanabe C. Identifying proteins from two-dimensional gels by molecular mass searching
of peptide fragments in protein sequence databases // Proceedings of the National Academy of Sciences of the United States of America. — 1993. — V. 90. — N. 11. — P. 5011-5015.
53.Gygi S.P., Corthals G.L., Zhang Y., Rochon Y., Aebersold R. Evaluation of two-dimensional gel electrophoresis-based proteome analysis technology // Proceedings of the National Academy of Sciences of the United States of America. — 2000. — V. 97. — N. 17. — P. 9390-9395.
54.Rabilloud T., Chevallet M., Luche S., Lelong C. Two-dimensional gel electrophoresis in proteomics: Past present and future // Journal of Proteomics.
— 2010. — V. 73. — N. 11. — P. 2064-2077.
55.Chevalier F. Highlights on the capacities of "Gel-based" proteomics // Proteome Science. — 2010. — V. 8. — P. 23-23.
56.Hu Q., Noll R.J., Li H., Makarov A., Hardman M., Graham Cooks R. The Orbitrap: a new mass spectrometer // Journal of Mass Spectrometry. — 2005.
— V. 40. — N. 4. — P. 430-443.
57.Eliuk S., Makarov A. Evolution of Orbitrap Mass Spectrometry Instrumentation // Annual Review of Analytical Chemistry. — 2015. — V. 8.
— P. 61-80.
58.Moruz L., Hoopmann M.R., Rosenlund M., Granholm V., Moritz R.L., Käll L. Mass Fingerprinting of Complex Mixtures: Protein Inference from HighResolution Peptide Masses and Predicted Retention Times // Journal of Proteome Research. — 2013. — V. 12. — N. 12. — P. 5730-5741.
59.Ivanov M.V., Levitsky L.I., Lobas A.A., Panic T., Laskay U.A., Mitulovic G., Schmid R., Pridatchenko M.L., Tsybin Y.O., Gorshkov M.V. Empirical multidimensional space for scoring peptide spectrum matches in shotgun proteomics // Journal of Proteome Research. — 2014. — V. 13. — N. 4. — P. 1911-1920.
60.Иванов М.В., Левицкий Л.И., Лобас А.А., Тарасова И.А., Придатченко М.Л., Згода В.Г., Мошковский С.А., Митулович Г., Горшков М.В.
Идентификация пептидов в "скорострельной" протеомике методами тандемной масс-спетрометрии: сравнение поисковых алгоритмов // Масс-спектрометрия. — 2015. — Т. 12. — N. 1. — С. 39-46.
61.Goloborodko A.A., Mayerhofer C., Zubarev A.R., Tarasova I.A., Gorshkov A.V., Zubarev R.A., Gorshkov M.V. Empirical approach to false discovery rate estimation in shotgun proteomics // Rapid Communications in Mass Spectrometry. — 2010. — V. 24. — N. 4. — P. 454-462.
62.Klammer A.A., Yi X., MacCoss M.J., Noble W.S. Improving tandem mass spectrum identification using peptide retention time prediction across diverse chromatography conditions // Analytical Chemistry. — 2007. — V. 79. — N. 16. — P. 6111-6118.
63.Gorshkov A.V., Tarasova I.A., Evreinov V.V., Savitski M.M., Nielsen M.L., Zubarev R.A., Gorshkov M.V. Liquid chromatography at critical conditions: comprehensive approach to sequence-dependent retention time prediction // Analytical Chemistry. — 2006. — V. 78. — N. 22. — P. 7770-7777.
64.Petritis K., Kangas L.J., Ferguson P.L., Anderson G.A., Pasa-Tolic L., Lipton M.S., Auberry K.J., Strittmatter E.F., Shen Y., Zhao R., Smith R.D. Use of artificial neural networks for the accurate prediction of peptide liquid chromatography elution times in proteome analyses // Analytical Chemistry. — 2003. — V. 75. — N. 5. — P. 1039-1048.
65.Silva J.C., Denny R., Dorschel C.A., Gorenstein M., Kass I.J., Li G.-Z., McKenna T., Nold M.J., Richardson K., Young P., Geromanos S. Quantitative proteomic analysis by accurate mass retention time pairs // Analytical Chemistry. — 2005. — V. 77. — N. 7. — P. 2187-2200.
66.Gilar M., Jaworski A., Olivova P., Gebler J.C. Peptide retention prediction applied to proteomic data analysis // Rapid Communications in Mass Spectrometry. — 2007. — V. 21. — N. 17. — P. 2813-2821.
67.Krokhin O.V., Craig R., Spicer V., Ens W., Standing K.G., Beavis R.C., Wilkins J.A. An improved model for prediction of retention times of tryptic
peptides in ion pair reversed-phase HPLC: its application to protein peptide mapping by off-line HPLC-MALDI MS // Molecular and Cellular Proteomics. — 2004. — V. 3. — N. 9. — P. 908-919. 68.Goloborodko A.A., Levitsky L.I., Ivanov M.V., Gorshkov M.V. Pyteomics--a Python framework for exploratory data analysis and rapid software prototyping in proteomics // Journal of the American Society for Mass Spectrometry. —
2013. — V. 24. — N. 2. — P. 301-304.
69.Ivanov M.V., Levitsky L.I., Gorshkov M.V. Adaptation of Decoy Fusion Strategy for Existing Multi-Stage Search Workflows // Journal of the American Society for Mass Spectrometry. — 2016. — V. 27. — N. 9. — P. 1579-1582.
70. Zhang B., Wang J., Wang X., Zhu J., Liu Q., Shi Z., Chambers M.C., Zimmerman L.J., Shaddox K.F., Kim S., Davies S.R., Wang S., Wang P., Kinsinger C.R., Rivers R.C., Rodriguez H., Townsend R.R., Ellis M.J.C., Carr S.A., Tabb D.L., Coffey R.J., Slebos R.J.C., Liebler D.C. NCI CPTAC: proteogenomic characterization of human colon and rectal cancer // Nature. —
2014. — V. 513. — N. 7518. — P. 382-387.
71.Creasy D.M., Cottrell J.S. Unimod: protein modifications for mass spectrometry // Proteomics. — 2004. — V. 4. — N. 6. — P. 1534-1536.
72.Ivanov M.V., Tarasova I.A., Levitsky L.I., Solovyeva E.M., Pridatchenko M.L., Lobas A.A., Bubis J.A., Gorshkov M.V. MS/MS-Free Protein Identification in Complex Mixtures Using Multiple Enzymes with Complementary Specificity // Journal of Proteome Research. — 2017. — V. 16. — N. 11. — P. 3989-3999.
73.Savitski M.M., Wilhelm M., Hahne H., Kuster B., Bantscheff M. A Scalable Approach for Protein False Discovery Rate Estimation in Large Proteomic Data Sets // Molecular and Cellular Proteomics. — 2015. — V. 14. — N. 9. — P. 2394-2404.
74.Vaudel M., Burkhart J.M., Zahedi R.P., Oveland E., Berven F.S., Sickmann A., Martens L., Barsnes H. PeptideShaker enables reanalysis of MS-derived proteomics data sets // Nature Biotechnology. — 2015. — V. 33. — P. 22-24.
75.Иванов М.В., Левицкий Л.И., Тарасова И.А., Горшков М.В. Pepxmltk -программа для конвертации результатов идентификации пептидов на основе данных тандемной масс-спектрометрии с использованием поискового алгоритма X!Tandem // Масс-спектрометрия. — 2014. — Т. 11.
— N. 3. — С. 179-181.
76.Zybailov B., Mosley A.L., Sardiu M.E., Coleman M.K., Florens L., Washburn M.P. Statistical analysis of membrane proteome expression changes in Saccharomyces cerevisiae // Journal of Proteome Research. — 2006. — V. 5.
— N. 9. — P. 2339-2347.
77.Tarasova I.A., Lobas A.A., Cernigoj U., Solovyeva E.M., Mahlberg B., Ivanov M.V., Panic-Jankovic T., Nagy Z., Pridatchenko M.L., Pungor A., Nemec B., Vidic U., Gaspersic J., Krajnc N.L., Vidic J., Gorshkov M.V., Mitulovic G. Depletion of human serum albumin in embryo culture media for in vitro fertilization using monolithic columns with immobilized antibodies // Electrophoresis. — 2016. — V. 37. — N. 17-18. — P. 2322-2327.
78.Griffin N.M., Yu J., Long F., Oh P., Shore S., Li Y., Koziol J.A., Schnitzer J.E. Label-free normalized quantification of complex mass spectrometry data for proteomic analysis // Nature Biotechnology. — 2010. — V. 28. — N. 1. — P. 83-89.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.