Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул тема диссертации и автореферата по ВАК РФ 01.04.17, кандидат физико-математических наук Тарасова, Ирина Алексеевна
- Специальность ВАК РФ01.04.17
- Количество страниц 108
Оглавление диссертации кандидат физико-математических наук Тарасова, Ирина Алексеевна
Общая характеристика работы.
1. Введение. Основные представления о предмете исследований.
1.1 Масс-спектрометрия как основной метод исследования биомолекул в протеомике.
1.2 Модели предсказания хроматографических времен удерживания белков и пептидов по их аминокислотной последовательности.
1.3 Жидкостная хроматография в критических условиях как метод исследования синтетических полимеров.
2. Теоретические основы концепции жидкостной хроматографии в критических условиях.
2.1 Модель случайных блужданий для гетерополимеров.
2.2 Эффективная энергия взаимодействия биомакромолекулы с поверхностью твердой фазы в градиентной хроматографии.
2.3 Основное уравнение градиентной хроматографии.
2.4 Система уравнений модели BioLCCC для определения объемов/времен удерживания пептидов.
3. Определение феноменологических параметров.
4. Апробация модели на экспериментальных данных.
4.1 Экспериментальные условия и методы исследования.
4.2 Корреляция экспериментальных и предсказанных времен удерживания на примере пептидных стандартов и дайджеста белков бактерии Escherichia Coli.
4.3 Предсказание разделения пептидов с модифицированными аминокислотными остатками на примере изомеров лейцин и изолейцин.
4.4 Предсказание разделения последовательностей с перестановкой аминокислот на примере пептидов с зеркально-симметричными текстами.
4.5 Практическое применение модели BioLCCC для фильтрации и верификации результатов поиска по базам данных в процессе идентификации пептидов и белков на примере Escherichia Coli.
Рекомендованный список диссертаций по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Универсальная шкала хроматографических времен удерживания биомакромолекул в задачах "скорострельной" протеомики2011 год, кандидат физико-математических наук Придатченко, Марина Леонидовна
Комплементарные физико-химические свойства пептидов и их использование в протеомных исследованиях2019 год, кандидат наук Лобас Анна Александровна
Разработка физико-химических подходов к разделению и идентификации пептидных продуктов с антибактериальными свойствами2010 год, кандидат химических наук Федоткина (Срибная), Олеся Сергеевна
Высокопроизводительный хромато-масс-спектрометрический анализ смесей протеолитических пептидов2018 год, кандидат наук Иванов, Марк Витальевич
Применение высокоэффективной жидкостной хроматографии и автоматического метода Эдмана при исследовании первичной структуры фактора элонгации EF-G1985 год, кандидат химических наук Винокуров, Леонид Михайлович
Введение диссертации (часть автореферата) на тему «Жидкостная хроматография в критических условиях в сочетании с масс-спектрометрией для изучения первичной структуры биомолекул»
Введение. Актуальность проблемы. В настоящее время задача определения первичной структуры белка, т. е. его аминокислотной последовательности, решается преимущественно методами тандемной масс-спектрометрии (МС/МС). В первую очередь это связано с тем, что масс-спектрометрический метод секвенирования белков является самым быстрым из всех известных. В протеомных исследованиях для осуществления МС/МС секвенирования распространение получили масс-анализаторы типа квадрупольной радиочастотной ловушки, времяпролетные масс-спектрометры, спектрометры ионного циклотронного резонанса, а также совсем новый тип масс-анализатора, получивший название "орбитальная ионная ловушка" (orbitrap). Масс-спектрометрия добилась несомненных успехов в области исследования и идентификации структуры белков и пептидов, а также в решении других задач протеомики и биоинформатики. В то же время многие исследователи отмечают высокий процент ложных идентификаций пептидов, а, следовательно, и белков, если определение их аминокислотной последовательности проводится исключительно по масс-спектрометрическим данным. В связи с этим существует необходимость развития новых, отличных от масс-спектрометрии, методов определения и идентификации аминокислотных последовательностей. Естественным представляется использование для этих целей высокоэффективной жидкостной хроматографии (ВЭЖХ). Во-первых, перечисленные выше типы масс-спектрометров работают "в связке" с хроматографом, позволяющим разделять сложные смеси пептидов, образующихся в результате ферментативного гидролиза белков, и, тем самым, упростить их МС/МС анализ. Во-вторых, хроматографическое разделение основано на взаимодействии макромолекулы с поверхностью, и это взаимодействие также отражает характер чередования аминокислотных остатков в цепи. Однако до 4 последнего времени хроматографические данные, т.е. объем или время удерживания, мало использовались или вообще не использовались для определения аминокислотной последовательности пептидов. Несмотря на возросший в последнее время интерес к хроматографии как к источнику дополнительной информации о первичной структуре пептидов и белков, до сих пор не было предложено такой содержательной физической теории, описывающей процессы разделения биомакромолекул, которая позволила бы связать закономерности разделения с "текстом" аминокислотной последовательности. Все существующие методики предсказания удерживания пептидов с известной последовательностью строились либо на основе моделей, развитых для низкомолекулярных соединений, либо на основе систем искусственного интеллекта. Это в лучшем случае позволяло "определить" средний аминокислотный состав пептида, но не характер чередования аминокислотных остатков в цепи.
Цель и задачи исследования. Основной целью и задачами работа были (1) разработка модели хроматографического разделения биомакромолекул (BioLCCC), учитывающей зависимость их хроматографического удерживания от первичной структуры -последовательности аминокислотных остатков; (2) экспериментальная верификация предложенной модели для предсказания времени и порядка выхода биомакромолекул с разными "текстами" в условиях градиентной хроматографии; (3) интеграция данных по последовательности цепи, получаемых в рамках развитого хроматографического подхода, с существующими экспертными системами МС/МС секвенирования для повышения достоверности идентификации белков и пептидов.
Научная новизна.
1. Впервые предложена физическая модель, описывающая взаимодействие связанных в цепь аминокислотных остатков биомакромолекулы с поверхностью, и учитывающая зависимость взаимодействия (статистической суммы) от их последовательности в цепи.
2. Впервые известная концепция жидкостной хроматографии в критических условиях, развитая ранее для исследования строения цепи синтетических полимеров, применена для описания разделения биомакромолекул в ВЭЖХ, в том числе и в условиях градиентной хроматографии.
3. Впервые экспериментально найдены эффективные энергии адсорбции 20 наиболее распространенных в природе аминокислотных остатков, а также концевых групп пептидов с гидрофобной поверхностью типа С]8.
4. Впервые модель хроматографического разделения пептидов применена, в том числе совместно с экспертными системами МС/МС секвенирования, для определения последовательностей пептидов, для идентификации модифицированных участков аминокислотных последовательностей, вызванных либо пострансляционными модификациями белков, либо мутациями в процессе их синтеза, либо перестановками аминокислотных остатков.
Практическое значение работы. Полученные результаты могут быть использованы исследователями, работающими в области протеомики, для решения следующих проблем:
S предсказания времен удерживания биомакромолекул с известной последовательностью, что позволит повысить достоверность идентификации пептидов и белков, полученных в результате хромато-масс-спектрометрического анализа;
S определения аминокислотных последовательностей неизвестных или отсутствующих в протеомных базах данных белков (de novo sequencing);
S определения или идентификации типа и места посттрансляционных модификаций в аминокислотной последовательности, а также изомерных аминокислот.
Личный вклад автора. Материал, представленный в диссертации, получен при непосредственном участии автора в постановке задач исследований, в выполнении экспериментов и в обсуждении полученных результатов. Диссертационная работа выполнена на кафедре химической физики Московского физико-технического института в лаборатории физических основ и техники масс-спектрометрии биополимеров Института энергетических проблем химической физики РАН в период с 2004 по 2007 год.
Апробация работы. Результаты работы докладывались и обсуждались на следующих российских и международных конференциях: 2-й Съезд Всероссийского масс-спектрометрического общества "Масс-спектрометрия и ее прикладные проблемы", 2005, Москва, Россия, 53-я Конференция Американского масс-спектрометрического общества, 2005, Сан Антонио, США, 17-я Международная масс-спектрометрическая конференция, 2006, Прага, Чехия, XLIX Научная конференция Московского физико-технического института, 2006, Москва, Россия, 54-я Конференция Американского масс-спектрометрического общества, 2006, Сиэтл, США, 3-я Школа-семинар "Масс-спектрометрия в химической физике, биофизике и экологии", 2007, Звенигород, Россия.
Публикации. Основное содержание диссертационной работы опубликовано в статьях, список которых приведен на стр. 95-96 диссертации. Работы, вошедшие в диссертацию, были выполнены при поддержке РФФИ (гранты №№ 03-04-48228, 06-04-49632), Российской Академии Наук (ОХНМ 4.2), CRDF (гранты №№ RUC1-5031-MO-04, RUE1-О00588-М0-05), и INTAS (Young Scientist Fellowship №04-83-2643 и Genomics-05-1000004-7759).
Изложение в диссертации построено следующим образом:
Похожие диссертационные работы по специальности «Химическая физика, в том числе физика горения и взрыва», 01.04.17 шифр ВАК
Анализ фотодинамики белковых комплексов тилакоидных мембран при помощи масс-спектрометрии высокого разрешения2011 год, кандидат химических наук Галецкий, Дмитрий Николаевич
Количественное профилирование смесей белков в задачах хроматомасс-спектрометрического анализа клеточных протеомов2022 год, кандидат наук Бубис Юлия Александровна
Структурно-функциональные особенности запасных и защитных белков растений и их использование в генетических исследованиях2010 год, доктор биологических наук Одинцова, Татьяна Игоревна
Разделение и идентификация низкомолекулярных линейных пептидов методом ВЭЖХ-МС на углеродном сорбенте2021 год, кандидат наук Милюшкин Алексей Леонидович
Физико-химические основы разделения и идентификации теллурорганических соединений2010 год, кандидат химических наук Сорокин, Александр Анатольевич
Заключение диссертации по теме «Химическая физика, в том числе физика горения и взрыва», Тарасова, Ирина Алексеевна
Заключение и выводы
В рамках данной работы была не только разработана достаточно корректная физическая модель хроматографического разделения пептидов, BioLCCC, но и проведено сравнение полученных с ее использованием результатов с альтернативным подходом к предсказанию удерживания в рамках модели SSRcalc. В заключение обсудим еще раз преимущества и недостатки данных моделей удерживания. Остановимся подробнее на конкретных примерах, показывающих различие в работе сравниваемых моделей предсказания удерживания. Рассмотрим перестановку концевых групп или «зеркальные» последовательности, описанные ранее в данной работе. Этот пример эквивалентен "перевороту" текста последовательности слева направо. Вообще говоря, не вполне очевидно, почему удерживание таких "перевернутых" последовательностей должно различаться. Впрочем, оно и не различается для гомополимера. Однако, если мы имеем дело с гетерополимером (пептидом), составленным из мономеров с разными энергиями притяжения, то перестановка концов по-разному влияет на все другие мономеры цепи. Это приводит к тому, что макромолекулы с "перевернутым" текстом могут разделяться, что и было продемонстрировано экспериментально (Рис. 15). Немаловажно отметить при этом, что концепция жидкостной хроматографии в критических условиях позволила правильно увидеть порядок выхода таких «зеркальных» пептидов. Модель SSRcalc в свою очередь не видит почти никакого различия в удерживании таких последовательностей при градиенте 1% В/мин, а при более медленном градиенте дает обратный экспериментальному порядок выхода пептидов
Последовательность Эксперимент BioLCCC SSRcalc
H-GALYIYLGDGLDTADAEG-amide 45.34 42.04 N/A
H-GEADATDLGDGLYIYLAG-amide 48.22 43.92 N/A
H-GALYIYLGDGLDTADAEG-OH 45.70 41.99 45.0
H-GEADATDLGDGLYIYLAG-OH 48.31 43.83 44.8
Так, в данной таблице приведены экспериментально измеренные и рассчитанные в рамках моделей BioLCCC и SSRcalc времена удерживания. Отметим, что в данном случае расчет по модели SSRcalc проводился для значений а = 22 мин, Ь = 0.63. Кроме того, в настоящее время модель SSRcalc позволяет делать расчет только для пептидов, имеющих концевые группы Я -peptide- ОН.
Другой пример также интересен. При экспериментах с пептидами белка Cytochrome С было замечено, что порядок выхода пептидов, характеризующихся близкими временами удерживания, инвертируется при замене градиента на более медленный (Рис. 26). Интересным и несколько неожиданным оказался тот факт, что разработанная в настоящей работе модель позволяет предсказать изменение порядка выхода таких пептидов при изменении градиента на более медленный! Не будет преувеличением утверждение, что на сегодняшний день это вообще единственная модель позволяющая увидеть и предсказать такой эффект. Физическая природа обнаруженного эффекта для пептидов с близкими временами удерживания может быть объяснена с позиции критической хроматографии следующим образом. Напомним, что непрерывный переход через критическую область
Gradient from 0 to 50%B in 30 min
Gradient from 0 to 35%B in 120 min
100| 9S| 90|
8 "J a «of sH
S 701 «ol « ssj «1 u 401
OS jsl
301 251 20| IS 1 101 S|
25.29
1 I TGPNLHGLFGR 1
1 1 1 25.68
1 1 1 1 1АЯЕ4<Ж
24 26 2« 30
Time, min
61.48
TGPNLHGLFGR
60.59.
MIFAGIK л Л .J,,,,,,,,,.
Time, min
Gradient from 0 to 50%B in 30 min Gradient from 0 to 35%B in 120 min
Peptide TGPNLHGLFGR MIFAGIK TGPNLHGLFGR MIFAGIK
RT„p 25.29 25.68 61.48 60.59
BioLCCC 25.15 26.05 61.77 60.00
SSRCalc 25.3 26.60 60.80 67.6
Рис. 26. Экспериментальное наблюдение изменения порядка выхода пептидов, имеющих близкие времена удерживания, при изменении условий градиентного элюирования [Gorshkov M.V. et al, готовится к печати]. для гетерополимера осуществляется не только на пути от эксюпозионного в адсорбционный режим хроматографии, но и, наоборот, при переходе от адсорбции к эксюпозии. Резкий градиент, реализующийся когда содержание ацетонитрила в бинарном растворителе быстро нарастает, соответствует ситуации, когда мы движемся к критической области со стороны эксюпозионного режима и в итоге пептид с более длинной последовательностью выходит из колонки первым. В то же время, медленный градиент соответствует обратной ситуации, когда во время элюирования преобладает адсорбционный режим, удерживание в котором тем больше, чем длиннее аминокислотная последовательность пептида.
Сравниваемые модели используют принципиально различные подходы к описанию и пониманию процесса хроматографического разделения пептидов. Если модель, предложенная и разработанная нами, отталкивается от феномена адсорбции и описывает поведение биомолекулы как .макромолекулы, с использованием методов статистической физики, то модель SSRcalc рассматривает биомолекулы как низкомолекулярные соединения, исходя из понятия гидрофобности пептида как основополагающего явления в хроматографии. Отметим, что аддитивный подход безусловно справедлив для низкомолекулярных соединений или достаточно коротких пептидов, т.к он неявно предполагает, что пептид лежит на поверхности «целиком» и взаимодействует с ней сразу всеми аминокислотами. Однако при увеличении длины цепи до 10-15 аминокислот удерживание заметно отклоняется от простой аддитивной модели. Поэтому дальнейшее развитие аддитивных моделей, и модели SSRcalc, в частности, строится на приведении в соответствие экспериментальных данных с предсказаниями путем введения в рассмотрение сложных нелинейных функций, аргументом которых, однако, по-прежнему остается суммирование коэффициентов удерживания аминокислот. Тем самым удается достаточно точно предсказать общие тенденции удерживания для цепей длиной 20-30 остатков - типичных для протеомных исследований.
Последовательности с одним и тем же аминокислотным составом, но различающиеся перестановками аминокислот, могут иметь разные объемы удерживания. Поэтому, следуя логике хроматографии низкомолекулярных соединений, в модели SSRcalc вводится понятие "эффекта соседа", и теория дополняется корректирующими параметрами, учитывающими влияние ближайших соседей мономера, взаимодействующего с поверхностью. Например, можно ввести различие во взаимодействии с поверхностью В в окружении А , А -В - А или в окружении В, В -В - В. Тем самым, вводя поправочные коэффициенты можно уточнять модель разделения и учесть, в том числе, и возможность разделения по текстам последовательности. В рамках модели BioLCCC, физическая причина различия в адсорбционном взаимодействии при перестановке мономеров в цепи лежит в связанности остатков в цепь и коллективном характере взаимодействия.
Аддитивная модель предполагает, что цепь целиком лежит на поверхности и все остатки взаимодействуют с поверхностью, однако, для длинных цепей это не так. Даже для гомополимеров равновесная конфигурация адсорбированной макромолекулы включает не только лежащие на поверхности (и взаимодействующие с ней) мономеры, но также и мономеры в петлях, простирающихся достаточно далеко в раствор, где мономеры не взаимодействуют с поверхностью. То же самое можно сказать и в отношении пептидов: наряду с сильно адсорбирующимися или, другими словами, гидрофобными остатками в цепи присутствуют и гидрофильные, отталкивающиеся от поверхности и способные образовывать петли, уходящие в раствор. Такая возможность учитывается в модели SSRcalc следующим образом. Обычно хроматография пептидов проводится на обращенной фазе в условиях, когда N - конец оказывается заряженным (в форме H3+N-) . Заряженность этого конца означает его сильное отталкивание от гидрофобной поверхности обращенной фазы ("изображение" заряда на гидрофобной поверхности имеет тот же знак, что и сам заряд). Тем самым, N - конец стремиться уйти подальше от поверхности, и утащить ковалентно привязанные к нему остатки. Следовательно, привязанные к N- концу остатки оказываются также удаленными от поверхности и их вклад во взаимодействие изменяется. Более того, оказывается существенным, какие остатки, гидрофобные или гидрофильные привязаны к N - концу. Очевидно, что если переставить местами остатки вблизи N - конца, то эффект такой перестановки может быть заметным. Таким образом, оказывается возможным "увидеть" элементы текста цепи вблизи N - конца, т.е. опять таки связать разделение не только с аминокислотным составом, но и с текстом. Такой подход значительно расширил возможности модели SSRcalc.
Тем не менее, предсказание объемов удерживания для пептидов с известным текстом в аддитивной модели основывается на рассмотрении пептидов "со стороны" низкомолекулярных соединений, т.е. рассмотрении их как "длинных" низкомолекулярных соединений. Собственно полимерная природа цепи при таком рассмотрении "учитывается" путем эмпирических поправок. Вместе с тем причина зависимости удерживания от последовательности имеет как раз полимерный характер. Если с самого начала положить в основу рассмотрения взаимодействия пептидов с поверхностью их полимерную природу, т.е. рассматривать их не как длинные низкомолекулярные соединения, а как короткие макромолекулы, то такое изменение точки зрения имеет определенные и обоснованные преимущества. В частности, при таком рассмотрении зависимость удерживания от текста цепи возникает естественным образом без необходимости задания множества дополнительных эмпирических параметров.
В чем же преимущество предлагаемой модели по сравнению с SSRcalc? Во-первых, в отличие от суммы индивидуальных свойств аминокислот, мы имеем произведение матриц, отражающих их индивидуальные свойства - энергии адсорбции аминокислотных остатков пептида. Свойства произведения матриц позволяют связать объем удерживания именно с текстом последовательности. Произведение матриц некоммутативно и, следовательно, зависит от порядка перемножения, задаваемого текстом последовательности.
Во-вторых, рассмотрение разделения пептидов "со стороны макромолекул" дает возможность проанализировать возможности хроматографии для чтения текста и интерпретации различий в разделении пептидов в терминах слабой дефектности в структуре (модификаций). Ясно, однако, что в общем случае такое соответствие цепи блужданий реальной макромолекуле пептида или белка (даже находящегося в клубкообразном состоянии) не вполне адекватно реальной ситуации. (Грубо говоря, в модели блужданий несколько "преувеличена" энтропийная составляющая во взаимодействии макромолекулы, а в аддитивной модели энтропийная составляющая, наоборот, сильно приуменьшена.)
Привязка модели BioLCCC к реальной системе осуществляется с помощью набора 20 феноменологических параметров - эффективных энергий взаимодействия, определяемых экспериментально. По сути, эффективная энергия адсорбции - это единственный нетривиальный параметр разработанной нами модели. Очевидно, что это эффективная энергия зависит от типа поверхности, от состава и компонентов растворителя и температуры.
Поскольку взаимодействие аминокислотных остатков с поверхностью ничем не отличается от взаимодействия низкомолекулярного аналога, для определения зависимости элюирующей силы растворителя в модели BioLCCC можно использовать корреляционную теорию, разработанную для низкомолекулярных веществ. Для рассматриваемой модели и формы переходной матрицы естественным является подход Снайдера, хотя он и не часто применяется в хроматографии на обращенной фазе. Возможно на обращенной фазе это действительно не лучшая модель, но она весьма проста и ее степень приближения соответствует степени приближения модели блужданий - в последней также пренебрегается взаимодействием с растворителем. Параметр, описывающий силу растворителя, имеет простой физический смысл эффективной энергии адсорбции компонента растворителя.
Такой подход содержит сильное допущение: пренебрежение взаимодействиями в растворе. Однако это предположение позволило нам «расцепить» свойства макромолекулы и растворителя (в смысле взаимодействия с поверхностью) и учесть влияние изменения состава растворителя на эффективную энергию взаимодействия.
Во избежание недоразумений, говоря в модели BioLCCC о влиянии перестановки на взаимодействие с поверхностью других мономеров, необходимо еще раз отметить следующее. Рассматриваемое влияние перестановки не связано с тем, что энергия взаимодействия аминокислотного остатка зависит от того, какие аминокислоты (ближайшие соседи) окружают его в аминокислотной последовательности. Так, в модели BioLCCC все энергии аминокислотных остатков, приведенные в таблице 1, фиксированы, но при перестановках в цепи меняются условия их взаимодействия с поверхностью (т.е. вероятность столкновения с поверхностью). В модели SSRcalc коэффициенты удерживания различны для одной и той же аминокислоты в зависимости от длины пептида и расположения аминокислоты в последовательности, т.е. зависят от ближайших соседей (т.е. удерживание мономера В в окружении А отличается от его удерживания в окружении С). Нельзя сказать, что такой подход неверен и «эффект ближайшего соседа» не имеет значения. Возможно, что именно этот эффект является доминирующим в изменении адсорбционного взаимодействия при перестановке мономеров. Однако нами было показано, что даже при пренебрежении влиянием ближайшего соседа на общее удерживание пептида перестановка остатков в цепи все равно приводит к изменению адсорбционного взаимодействия. В целом, какое явление является определяющим в изменении удерживания при перестановках, «влияние ближайшего соседа» или связанность мономеров в цепь - покажут будущие исследования.
Еще один важный вопрос - влияние модификации аминокислотного остатка и места расположения этой модификации в аминокислотной последовательности на хроматографическое удерживание пептида. Модификация аминокислоты (например, посттрансляционная) в рамках концепции жидкостной хроматографии в критических условиях меняет ее энергию взаимодействия, а сам по себе этот факт может быть легко обнаружен по изменению массы пептида, а также и по изменению объема удерживания. В рамках аддитивной модели модификации легко учитываются, так что интерпретация хроматографических данных в этом случае проще, чем при перестановке звеньев в цепи. Однако, интересен не только сам факт однократной или многократной модификации цепи, но и место, где произошла такая модификация. В такой постановке задача заметно усложняется и для определения места модификации необходимо прибегать к секвенированию. Изменение взаимодействия с поверхностью одного из мономеров меняет не только его условия взаимодействия с поверхностью, но и «привязанных» к нему соседей по цепи. Таким образом, общее взаимодействие всей цепи зависит от того, в каком месте цепи произошла модификация. Модель BioLCCC предсказывает, что пептиды должны разделяться также и по месту замененной группы.
Предложенный подход представляет собой, образно говоря, "первое приближение" к решению проблемы - многие детали строения реальной структуры пептида оказываются за рамками рассмотрения, однако, они, в принципе, способны заметно "исказить" нарисованную выше идеальную картину. Поэтому следует отметить и "слабые места" предложенной модели, в частности, для того чтобы более корректно соответствовать экспериментальным данным в будущем.
Сам факт представления об аминокислотной последовательности пептида как о цепи случайных блужданий, конечно, явно модельное приближение. Достаточно длинные последовательности, содержащие порядка 100 мономеров, в денатурированном, клубкообразном состоянии, как и макромолекулы обычных синтетических полимеров, достаточно хорошо моделируются гауссовым клубком. В этом случае предложенная модель правильно отражает физическую суть взаимодействия с поверхностью. Однако короткие пептиды вряд ли можно отождествить с клубком: это могут быть стержни, изогнутые стержни или даже куски спирали. Это не устраняет коллективного характера взаимодействия с поверхностью составляющих их аминокислот, но характер пространственной корреляции, а, следовательно, и влияние текста, уже отличается от гауссового клубка. В общем можно сказать, что для таких слабо флуктуирующих пептидов аддитивная модель скорее ближе к реальности. В этом случае существенны только перестановки вблизи концов цепи на расстоянии порядка радиуса взаимодействия с поверхностью, перестановки же мономеров в середине несущественны. Вообще говоря, нет особых проблем учесть жесткость цепи и в модели блужданий (введением, например, разной вероятности перехода вперед и вбок). Сложность модели при этом возрастет незначительно. Однако следует помнить, что жесткость цепи также может зависеть от первичной последовательности, и для корректного учета потребуется введение, а главное, экспериментальное определение новых параметров, отражающих упомянутое явление.
Другое очевидное ограничение модели BioLCCC - предположение о локальности взаимодействия, присутствующее в модели (и, как следствие, в переходной матрице (1)). Реальные пептиды содержат ионногенные группы (К, R, Н), которые в условиях хроматографического эксперимента обладают положительным зарядом. Действительно, экспериментально было обнаружено, что для пептидов, содержащих более двух сильно заряженных аминокислот, предсказанные по модели BioLCCC времена удерживания оказываются всегда больше, чем регистрируемые на опыте. Кроме того, электростатическое отталкивание заряженных аминокислот от гидрофобной поверхности является, конечно, нелокальным. Однако нелокальность взаимодействия также можно учесть в рамках предложенной модели, вводя в переходную матрицу взаимодействие со второго слоя. В настоящий момент это еще не реализовано и находится в стадии разработок. Отметим, что в модели SSRcalc на данный момент уже введены эмпирические поправки, позволяющие учитывать наличие сильно заряженных аминокислотных остатков в цепи и их влияние на удерживание пептидов.
Считаем нужным отметить, что предложенная модель BioLCCC не специфична к конкретному типу взаимодействий и может быть применена для описания других вариантов хроматографического разделения белков и пептидов, например, в ионнообменной или аффинной хроматографии. Для применимости модели к другим вариантам хроматографии, конечно, необходимо переопределить стандартные энергии адсорбции остатков для фаз и растворителей, применяемых в этих вариантах хроматографии с помощью модельных пептидов, как это было сделано для обращенной фазы Cig. Модель SSRcalc также может быть применена к описанию других вариантов хроматографии, однако, переопределение параметров данной модели в виду их большого количества (порядка нескольких сотен) потребует значительно более долгой и кропотливой работы.
Упомянутые выше ограничения на предложенную нами модель должны быть предметом дальнейших теоретических и экспериментальных исследований.
Тем не менее, несмотря на ограничения, предлагаемый нами подход является продуктивным и обоснованным и позволяет более эффективно вовлекать хроматографические данные в протеомный анализ при идентификации и секвенировании пептидов и белков.
Сформулируем кратко основные результаты и выводы, полученные в данной работе:
1. Предложена физическая модель хроматографического разделения биополимеров, белков и пептидов, учитывающая связанность аминокислотных остатков в цепь и макромолекулярный характер поведения биомолекул при их взаимодействии с поверхностью адсорбента.
2. Развита количественная теория градиентной хроматографии биополимеров, в основе которой лежит концепция жидкостной хроматографии в критических условиях.
3. Теоретически показано, что в условиях градиентного элюирования разделение биополимеров и, следовательно, времена удерживания в колонке определяются их критическими условиями (состав смеси бинарного растворителя, температура), соответствующими балансу между энергией взаимодействия аминокислотных остатков с поверхностью и энтропийными потерями цепи аминокислотных остатков биополимера.
4. С использованием развитых теоретических подходов определены энергии взаимодействия с поверхностью обращенной фазы для 20 наиболее распространенных в природе аминокислотных остатков и 4 типов концевых групп, которые являются феноменологическими параметрами предложенной модели хроматографического разделения биополимеров.
5. Экспериментально и теоретически показано, что предложенная макромолекулярная модель хроматографического разделения биополимеров позволяет предсказывать объем или время удерживания биомолекул в зависимости от их аминокислотной последовательности.
6. Показано, что предложенная модель хроматографического разделения биополимеров позволяет количественно и качественно определять порядок выхода биополимеров, отличающихся либо изомерными, либо модифицированными формами аминокислотных остатков.
7. Экспериментально показана возможность использования модели критической хроматографии биополимеров в сочетании с масс-спектрометрией в протеомных исследованиях: определения первичной структуры биополимеров, идентификации посттрансляционных модификаций и секвенировании неизвестных белков и пептидов (de novo секвенирование).
Список литературы диссертационного исследования кандидат физико-математических наук Тарасова, Ирина Алексеевна, 2007 год
1. Wong S.F., Meng C.K., Fenn J.B., "Multiple Charging in Electrospray 1.nization of Poly(Ethylene Glycols)", J. Phys. Chem., 92(2), pp. 546-550 (1988).
2. Tanaka K., Waki H., Ido Y., Akita S., Yoshida Y., Yoshida Т., "Protein and Polymer Analyses up to m/z 100 000 by Laser Ionization Time-of-Flight Mass Spectrometry", Rapid Commun. Mass Spectrom., 2(8), pp. 151-153 (1988).
3. Brancia F.L., "Recent developments in ion-trap mass spectrometry and related technologies", Expert Review of Proteomics, 3(1), pp. 143-151 (2006).
4. Roepstorff P., "MALDI-TOF mass spectrometry in protein chemistry", EXS., 88, pp. 81-97 (2000).
5. Marshall A.G., Verdun F.R., "Fourier transforms in NMR, optical, and mass spectrometry", A User's Handbook, Elsevier Science Publishing Company Inc., New York, pp. 450 (1990).
6. Makarov A., "Electrostatic axially harmonic orbital trapping: a high performance technique of mass analysis", Anal. Chem., 72(6), pp. 1156-62 (2000).
7. Pandey A., Mann M., "Proteomics to study genes and genomes", Nature, 405(6788), pp. 837-846 (2000).
8. Aebersold R., Mann M., "Mass spectrometry-based proteomics", Nature, 422, pp. 198-207 (2003).
9. Wells J.M., McLuckey S.A., "Collision-induced dissociation (CID) of peptides and proteins", Methods Enzymol., 402, pp. 148-185 (2005).
10. Little D.P., Speir J.P., Senko M.V., O'Connor P.B., McLafferty F.W., "IRMPD of large multiply charged ions for biomolecule sequencing", Anal Chem., 66(18), pp. 2809-15 (1994).
11. Zubarev R.A., Kelleher N.L., McLafferty F.W., "ECD of multiply charged protein cations. A nonergodic process", J. Am. Chem. Soc., 120(13), pp. 3265-3266 (1998).
12. Syka J.E., Coon J.J., Schroeder M.J., Shabanowitz J., Hunt D.F., "Peptide and Protein sequence analysis by ETD MS", PNAS, 101(26), pp. 9528-33; 10.1073/pnas.0402700101 (2004).
13. Abbott A., "A post-genomic challenge: learning to read patterns of protein synthesis", Nature, 402, pp. 715-720, (1999).
14. Zubarev R. A., Hakansson P., Sundqvist В., "Accuracy requirements for peptide characterization by monoisotopic molecular mass measurements", Analytical Chemistry, 68(22), pp. 4060-63 (1996).
15. Mann M., Hendrickson R. C., Pandey A., "Analysis of proteins and proteomes by mass spectrometry", Annual Reviews in Biochemistry, 70, pp. 437-473 (2001).
16. Perkins D. N., Pappin D. J. C., Creasy D. M., Cottrell J. S., "Probability based protein identification by searching sequence databases using mass spectrometry data", Electrophoresis, 20(18), pp. 3551-3567 (1999).
17. Eng J. K., McCormack A. L., Yates J. R., "An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database", J. Am. Soc. Mass Spectrom., 5, pp. 976 -989 (1994).
18. Craig R., Beavis R.C., "TANDEM: matching proteins with mass spectra", Bioinformatics, 20, pp. 1466-7 (2004).
19. Geer L.Y., Markey S.P., Kowalak J.A., Wagner L., Xu M., Maynard D.M., Yang X., Shi W., Bryant S.H., "Open Mass Spectrometry Search Algorithm", JProteome Res., 3(5), pp. 958-64 (2004).
20. Meek J.L., "Prediction of peptide retention times in high pressure liquid chromatography on the basis of amino acid composition", Proc. Natl. Acad. Sci. USA, 77(3), p. 1632-1636 (1980).
21. M.T.W. Hearn, M.J. Aguilar, C.T. Mant, R.S. Hodges, "High performance liquid chromatography of amino acids, peptides and proteins. LXXXV.
22. Evaluation of the use of hydrophobicity coefficients for the prediction of peptide elution profiles", J. Chromatography, 438, pp.197-210 (1988).
23. C.T. Mant, T.W.L. Burke, J.A. Black R.S. Hodges, "Effect of peptide chain length on peptide retention behaviour in reversed-phase chromatography", J. Chromatography, 458, pp. 193-205 (1988).
24. Nielsen M. L., Savitski M. M., Zubarev R. A., "Improving Protein Identification Using Complementary Fragmentation Techniques in Fourier Transform Mass Spectrometiy", Mol. Cell Proteom., 4, pp.835- 845 (2004).
25. Sunyaev S., Liska A. J., Golod A., Shevchenko A., Shevchenko A., "MultiTag: multiple error-tolerant sequence tag search for the sequence-similarity identification of proteins by mass spectrometry", Anal. Chem., 75, pp.1307—1315 (2003).
26. Mann M., Wilm M., "Error-tolerant identification of peptides in sequence databases by peptide sequence tags", Anal. Chem., 66(24), pp.4390 4399. (1994).
27. Bern M., Goldberg D., McDonald W. H., Yates J. R., "Automatic quality assessment of peptide tandem mass spectra", 12th International Conference on Intelligent Systems for Molecular Biology (ISMB 2004); 2004 July 31 -August 4; Glasgow; Scotland.
28. McLafferty F. W., Fridriksson E. K., Horn D. M., Lewis M. A., Zubarev R. A., "Biochemistry. Biomolecule mass spectrometry", Science, 21, pp.1289 -1290(1999).
29. Fernandez F. M., Wysocki V.H., Futrell J.H., "Protein identification via surface-induced dissociation in an FT-ICR mass spectrometer and a patchwork sequencing approach", J. Am. Soc. Mass Spectrom., 17 (5), pp.700-709 (2006).
30. Marshall A.G., Hendrickson Ch.L., Jackson G.S., "Fourier Transform Ion Cyclotron Resonance Mass Spectrometry: A Primer", Mass Spectrometry Reviews, 17, pp. 1-35 (1998).
31. Shaffer S.A., Tang K.Q., Anderson G.A., Prior D.C., Udseth H.R., Smith R.D., "A novel ion funnel for focusing ions at elevated pressure using electrospray ionization mass spectrometry", Rapid Commun. Mass Spectrom., 11, 1813-1817(1997).
32. Gorshkov M.V., Pasa-Tolic L., Bruce J.E., Anderson G.A., Smith R.D., "A dual-trap design and its applications in electrospray ionization FTICR mass spectrometry", Anal Chem., 69, 1307-1314(1997).
33. Palmblad, M.; Ramstrom, M.; Markides, К. E.; Hakansson, P.; Bergquist, "Prediction of Chromatography Retention and Protein Identification in Liquid Chromatography/Mass Spectrometry", J. Anal. Chem., 74, 5826-5830 (2002).
34. Klammer A.A., Yi X., MacCoss M.J., Noble W. S., "Peptide Retention Time Prediction Yields Improved Tandem Mass Spectrum Identification for Diverse Chromatography Conditions", RECOMB 2007, pp. 459-472.
35. Meek J.L., Rossetti Z.L., "Factors affecting retention and resolution of peptides in high performance liquid chromatography", J. Chromatogr., 211(1), p.15-28 (1981).
36. Su S.J., Grego В., Niven В., Hearn M.T.W., "Analysis of Group retention contributions for peptides separated by reversed-phase high performance liquid chromatography", J. Liq. Chromatogr., 4(10), p. 1745-1764 (1981).
37. Wilson K.J., Honegger A., Slottzel R.P., Hughes G.H., "The behaviour of peptides on reversed phase supports during high pressure liquid chromatography", Biochem. J., 199, p.31 (1981).
38. Browne C.A., Bennett H.P.J., Solomon S., "The isolation of peptides by high-performance liquid chromatography using predicted elution positions", Anal. Biochem., 124(1), p.201-8 (1982).
39. Sasagawa Т., Okuyama Т., Teller D.C., "Prediction of peptide retention times in reversed phases high performance liquid chromatography during linear gradient elution", J. Chromatogr., 240(2), p.329-340 (1982).
40. Sasagawa Т., Ericsson L.H., Teller D.C., Titani K., Walsh K.A., "Separation of peptides on a polystyrene resin column", J. Chromatogr., 307, p.29-38 (1984).
41. Sakamoto Y., Kawakami N., Sasagawa Т., "Prediction of peptide retention times", J. Chromatogr., 442, p.69-79 (1988).
42. Palmblad, M.; Ramstrom, M.; Bailey, C. G.; McCutchen-Maloney, S. L.; Bergquist, J.; Zeller, L. C., "Protein identification by liquid chromatography using retention time prediction", J. Chromatogr., B, 803, 131-135 (2004).
43. Azarova I.N., Baram G.I., Gol'dberg E.L., "Prediction of Retention Volumes and UV Spectra of Peptides in Reversed Phase HPLC", Russian Journal ofBioorganic Chemistry, 32(1), pp.50-56 (2006).
44. Baczek, Т., Wiczling, P., Marszall, M., Hey den, Y.V., Kaliszan, R., "Prediction of peptide retention at different hplc conditions from multiple linear regression models", JProteome Res, pp. 555-63 (2004).
45. Lewis D.P., Jebara Т., Noble W.S., "Support vector machine learning from heterogeneous data: an empirical analysis using protein sequence and structure", Bioinformatics, 22(22), pp. 2753-2760 (2006).
46. Ben-Hur A., NobleW.S., "Kernel methods for predicting protein-protein interactions", ISMB (Supplement of Bioinformatics), pp. 38-46 (2005).
47. Ling C.X., Noble W.S., Yang Q., "Guest Editors' Introduction to the Special Issue: Machine Learning for Bioinformatics Part 1", IEEE/ACM Trans. Comput. Biology Bioinform., 2(2), pp.81-82 (2005).
48. Ling C.X., Noble W.S., Yang Q., "Guest Editor's Introduction to the Special Issue: Machine Learning for Bioinformatics-Part 2", IEEE/ACM Trans. Comput. Biology Bioinform., 2(3), pp. 177-178 (2005).
49. Eskin E., Noble W.S., Singer Y., "Protein Family Classification Using Sparse Markov Transducers", Journal of Computational Biology, 10(2), pp. 187-214 (2003).
50. Liao L., Noble W.S., "Combining Pairwise Sequence Similarity and Support Vector Machines for Detecting Remote Protein Evolutionary and Structural Relationships", Journal of Computational Biology, 10(6), pp.85 7-868 (2003).
51. Riddle L. A., Guiochon G., "Influence of Mobile Phase Gradients on the Retention and Separation of Peptides from a Cytochrome-c Digest by Reversed-Phase Liquid Chromatography", Chromatographia, 64, pp. 121— 127 (2006).
52. Кузаев A.M., Суслова E.H., Энтелис С.Г., "Адсорбционные эффекты в гель проникающей хроматографии. II Полистерольные гели", Журн. Физ. Химии, 48(6), 1493-1495 (1974).
53. Де Жен П., Идеи скейлинга в физике полимеров. М.: Мир, 1982, стр. 368.
54. Лифшиц И.М., "Некоторые вопросы статистической теории биополимеров", ЖЭТФ, т. 55, №6, стр. 221 (1968).
55. De Gennes P.-G., "Some Conformation Problems for Long Macromolecules", Rep. Prog. Phys., v.32, p. 187-205 (1969).
56. Hoeve C.A.J., Di Marzio E.A., Peyser P., "Adsorption of Polymer Molecules at Low Surface Coverage", J. Chem. Phys., No.2, pp.2558-2563 (1965).
57. Di Marzio E.A., Rubin R., "Adsorption of Chain Polymer Between Two Plates", J. Chem. Phys., v.55, No.9, p. 4318-4336 (1971).
58. Горшков A.B., «Критическая хроматография макромолекул», диссертация на соискание степени доктора физ.-мат. наук, 2002.
59. Скворцов A.M., Беленький Б.Г., Ганкина Э.С., Тенников М.Б., "О соответствии поведения реальной макромолекулы и гауссовой цепи при адсорбции в порах", Высокомолекулярные соединения, А, т.20, №3, с.678-686 (1978).
60. Горшков А.В., Евреинов В.В., Энтелис С.Г., "Хроматография в критических условиях и разделение макромолекул по функциональности и топологии", Докл. АН СССР, т.272, №3, с.632-635 (1983).
61. Entelis S.G., Evreinov V.V., Gorshkov A.V., "Functionality and Molecular Weight Distribution of Telechelic Polymers", Adv. In Polymer Science, v.76, p. 129-175 (1986).
62. Snyder, Principles of Adsorption Chromatography, (N.Y.: Dekker, 1968).
63. Snyder L.R., Saunders D.L., "Optimized solvent programming for separations of complex samples by liquid solid adsorption chromatography in columns", J. Chromatogr. Sci., 7(4), pp. 195-208 (1969).
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.