База знаний по цитохромам Р450: разработка и применение тема диссертации и автореферата по ВАК РФ 03.00.28, доктор биологических наук Лисица, Андрей Валерьевич

  • Лисица, Андрей Валерьевич
  • доктор биологических наукдоктор биологических наук
  • 2007, Москва
  • Специальность ВАК РФ03.00.28
  • Количество страниц 274
Лисица, Андрей Валерьевич. База знаний по цитохромам Р450: разработка и применение: дис. доктор биологических наук: 03.00.28 - Биоинформатика. Москва. 2007. 274 с.

Оглавление диссертации доктор биологических наук Лисица, Андрей Валерьевич

1. ВВЕДЕНИЕ.

2. ОБЗОР ЛИТЕРАТУРЫ.

2.1. Информационные системы в молекулярной биологии.

2.1.1. Глобальные информационные ресурсы.

2.1.3. Медиаторные системы.

2.1.4. Автоматизация поддержки информационных ресурсов.

2.2. Информационный анализ первичной структуры белка.

2.2.1. Выравнивание первичной структуры белков.

2.2.2. Статистическая оценка результатов выравнивания.

2.2.3. Информационные характеристики белковых структур.

23. Вычислительные методы классификации белков.

2.3.1. Классификация белков с применением алгоритмов выравнивания.

2.3.2. Методы определения сходства белков без выравнивания.

2.3.3. Пакет программ PHYLIP.

2.4. Биоинформационные исследования надсемейства Р

2.4.1. Номенклатура надсемейства цитохромов Р450.

2.4.2. Аннотирование новых генов цитохромов Р450.

2.4.3. Основные структурные элементы цитохромов Р450.

2.4.4. Структурно-функциональный подход к классификации цитохромов Р450.

2.4.5. Цитохромы Р450 в компьютерном конструировании лекарств.

2.4.6. Обзор информационных ресурсов по тематике цитохромов Р450.

3. ИСХОДНЫЕ ДАННЫЕ И МЕТОДЫ ИХ ОБРАБОТКИ.

3.1. Исходные данные.

3.2. Локальное выравнивание.

3.3. Парное глобальное выравнивание.

3.4. Множественное выравнивание

3.5. Метод выявления структурно-функциональных мотивов

3.6. Кластерный анализ и определение оптимального уровня отсечения.

3.7. Другие методы

4. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

4.1. Описание базы знаний по цитохромам P4S

4.1.1. Общие принципы построения информационной системы.

4.1.2. Главное меню программы.

4.1.3. Обращения к категориям данных.

4.1.4. Специальные возможности поиска данных.

4.1.5. Механизм формирования выборок.

4.1.6. Функции подготовки отчетов и экспорта данных.

4.2. Применение базы знаний.

4.2.1. Инвентаризация и индексация надсемейства цитохромов Р450.

4.2.2. Определение кластеров в составе надсемейства.

4.2.3. Общее и частное в структуре белков надсемейства цитохромов Р450.

4.2.4. Подходы к конструированию новых форм цитохромов Р450.

4.2.5. Анализ субстратной специфичности цитохромов Р450.

4.3. Способы верификации результатов виртуального эксперимента.

4.3.1. Определение оптимальных параметров выравнивания.

4.3.2. Определение оптимальной структуры протеомного индекса.

4.3.3. Оценка достоверности критериев выявления структурно-функциональных мотивов.

4.4. Технологии внесения новых данных в базу знаний

4.4.1. Обновление информации по первичным структурам цитохромов Р450.

4.4.2. Ввод данных о функциональных свойствах цитохромов Р450.

5. ВЫВОДЫ.

6. СПИСОК НАУЧНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ.

Рекомендованный список диссертаций по специальности «Биоинформатика», 03.00.28 шифр ВАК

Введение диссертации (часть автореферата) на тему «База знаний по цитохромам Р450: разработка и применение»

1.1 Актуальность проблемы, цель и задачи работы

Концепция замещения ранее созданных баз данных - статических информационных ресурсов - динамически развивающимися базами знаний обусловлена необходимостью оперативной разноплановой обработки накапливающегося экспериментального материала. Отличительным признаком базы знаний является гибкая структура данных, способная эффективно адаптироваться к быстро меняющимся условиям поставленной задачи. Особенно актуальной способность к адаптации становится в приложении к задачам биологии, характеризующимся противоречием между неполнотой экспериментальных данных и системной целостностью объекта исследования -живого организма.

Изучение молекулярных процессов является наиболее глубинным способом анализа живых систем. Проведение широкомасштабных исследований на молекулярном уровне стало возможным благодаря появлению высокоэффективных экспериментальных технологий. Достижения геномных и постгеномных технологий вывели на первый план задачи, связанные с хранением и обработкой получаемой информации. Качественный скачок в развитии молекулярной биологии, обусловленный внедрением новых технологий и накоплением множества разрозненных, но взаимодополняющих экспериментальных данных, ознаменовался появлением новой научной дисциплины - системной биологии [Вигга§е е1 а1., 2006]. В рамках системной биологии концепцию базы знаний применяют для выявления скрытых закономерностей в накопленных данных.

Системные подходы в молекулярной биологии находят свое отражение в развитии баз знаний на основе исторически сложившихся глобальных информационных ресурсов: на смену базе данных по первичной структуре белковых последовательностей 8\У188РкЛ [http://au.expasv.org/sprot/] приходит ресурс нового поколения - база знаний итРпй [http://www.expasy.uniprot.org/]: база данных геномных последовательностей ОепВапк [http://www.ncbi.nlm.nih.gov/Genbank/index.html] в настоящее время также оснащена целым арсеналом вспомогательных алгоритмических средств работы с данными. Вышеперечисленные системы являются интегральными, что подразумевает хранение информации обо всем разнообразии генов и белков.

С существенным отставанием от глобальных систем хранения информации развиваются объектно-ориентированные базы знаний, к которым относится база знаний по цитохромам Р450. Задачей объектно-ориентированных ресурсов является сбор всех имеющихся данных об одном классе белков.

Объектная ориентированность базы знаний по цитохромам Р450 определяет ее уникальность и очерчивает область ее потенциального применения в научных исследованиях. База знаний позволяет параллельно накапливать информацию о структурном и функциональном разнообразии цитохромов Р450. Структурный и функциональный потоки аккумулируют данные независимо друг от друга, формируя объективные предпосылки для выдвижения гипотез о наличии структурно-функциональных взаимосвязей. Развитие гипотез происходит в контексте определенной статистической или алгоритмической модели, которая строится исходя из одного типа данных, а проверяется на другом. Так, рассматриваемая в работе «островная гипотеза» [№зЫка\уа, 1993] строения белковых молекул, в рамках базы знаний формализуется в виде статистического метода выявления структурных мотивов двух типов путем сравнительного анализа последовательностей аминокислотных остатков [Ыв^а й а1., 2003]. Найденные структурные мотивы затем используются для корректировки существующей классификации надсемейства цитохромов Р450. Вносимые в номенклатуру надсемейства корректировки, т.е. отличия традиционной классификации от варианта, построенного на основе «островной гипотезы», составляют сущность нового знания о структурно-функциональных взаимосвязях в надсемействе цитохромов Р450.

Высокая значимость представляемой работы определяется важностью биологической роли ферментов надсемейства цитохромов Р450. Реализуемая цитохромами Р450 реакция монооксигеназного катализа является необходимым звеном в обеспечении жизнедеятельности организмов, начиная с простейших и заканчивая многоклеточными эукариотами. Многогранность каталитических особенностей, структурное разнообразие известных генетических форм, широкий арсенал методов экспериментальных исследований делают цитохромы

Р450 актуальным объектом для апробации технологии создания объектно-ориентированной базы знаний.

Цель работы - создать информационно-вычислительный ресурс (базу знаний), позволяющий проводить систематизированный анализ общедоступных данных о структурных и функциональных особенностях белков надсемейства цитохромов Р450. База знаний должна предоставлять интегрированную платформу для проведения исследований надсемейства биоинформационными методами. В рамках достижения поставленной цели сформулированы следующие задачи:

1. Разработать структуру данных и способы автоматизации процедуры пополнения информационного массива; реализовать контекстно-зависимые схемы адаптации структуры данных; обеспечить автоматические средства сопряжения базы знаний с другими информационными системами.

2. Внести в базу знаний сведения о структуре и функции цитохромов Р450, в полном объеме отражающие современный уровень исследований в данной области.

3. Интегрировать в базу знаний алгоритмы биоинформатики, предназначенные для сравнительного анализа последовательностей аминокислотных остатков; разработать интерактивные средства работы с этими алгоритмами.

4. С использованием базы знаний выполнить комплекс работ по анализу структурно-функциональных особенностей цитохромов Р450 и предложить объективные подходы к классификации белков этого надсемейства.

1.2. Научная новизна и практическая значимость

В представленной работе впервые показана возможность создания базы знаний и её последующего применения для решения научно-исследовательских задач, связанных с анализом надсемейства цитохромов Р450. База знаний доступна в сети Интернет по адресу [http://cpd.ibmh.msk.su].

Разработан способ формализации эмпирических знаний, накопленных в результате экспериментов по изучению структуры и функции цитохромов Р450, и предоставлен интерактивный доступ к широкому спектру биоинформационных алгоритмов, таких, как алгоритмы выравнивания последовательностей, кластерного анализа, методы построения консенсусных последовательностей и выявления структурно-функциональных мотивов.

Предложена новая система объективной классификации надсемейства цитохромов Р450, основанная на принципах автоматического анализа структурного, функционального и эволюционного сходства белков. Для объективной оценки разработан инструментарий оригинальных методов, включающий:

- метод иерархического выравнивания консенсусных последовательностей;

- метод структурно-функционального картирования белков, предназначенный для обозначения на аминокислотной последовательности элементов вторичной структуры белка, субстрат-связывающих участков, точечных мутаций, структурно-функциональных мотивов и др.

- метод инвентаризации надсемейства, позволяющий распределить белки по кластерам и реконструировать последовательность-предшественник для каждого кластера;

- метод индексирования белков, позволяющий отразить процесс эволюционного развития белкового надсемейства;

- метод выявления структурно-функциональных мотивов, как статистически-значимых локальных участков консервативности в составе консенсусной последовательности

Разработанный комплекс подходов применяется для прогнозирования функциональной специфичности новых форм цитохромов Р450; информация, содержащаяся в базе знаний, востребована при моделировании пространственных структур цитохромов Р450 и при анализе взаимосвязей между структурой и функцией белка. Выявленные с использованием базы знаний структурно-функциональные мотивы могут быть использованы при планировании генно-инженерных экспериментов по созданию искусственных форм цитохромов Р450 с новыми функциями. Также важна практическая роль разработанной базы знаний в качестве интерактивного справочного и обучающего пособия.

Впервые для отдельного надсемейства белков представлены результаты масштабного технологического программирования, ориентированного на организацию взаимосвязанных сценариев работы пользователя с данными. Разработанные сценарии включают в себя до восьми этапов, на каждом из которых пользователь получает дополнительную информацию об объекте исследования. Эта информация потенциально является основой для построения научных гипотез и дальнейшего рационального планирования научно-исследовательской работы. Апробированные технологические приемы могут быть перенесены на другие группы белков (помимо цитохромов Р450) и представляют практическую значимость с точки зрения развития современных подходов к обработке молекулярно-биологических данных.

1.3. Структура изложения материала

Работа содержит главы «Обзор литературы», «Исходные данные и методы их обработки», «Результаты и обсуждение». В обзоре литературы рассматриваются характеристики современных информационных систем и способы обработки первичных структур белков. Отмечаются основные методические наработки, которые в том или ином виде нашли отражение в базе знаний по цитохромам Р450. В главе «Исходные данные и методы их обработки» читатель знакомится со спецификой представленной в базе знаний информации и с описанием интегрированных в информационную систему алгоритмических разработок.

Глава «Результаты и обсуждение» содержит три принципиально важных подраздела. Первый из них посвящен описанию функций базы знаний с точки зрения пользователя ресурса. В следующий подраздел «Применение базы знаний» включены результаты исследовательских работ, направленных, главным образом, на автоматизированный анализ взаимосвязей между структурой и функциями в надсемействе цитохромов Р450.

Наконец в разделе «Способы верификации результатов виртуального эксперимента» рассматриваются принципы проверки достоверности результатов биоинформационных исследований.

2. ОБЗОР ЛИТЕРАТУРЫ

Похожие диссертационные работы по специальности «Биоинформатика», 03.00.28 шифр ВАК

Заключение диссертации по теме «Биоинформатика», Лисица, Андрей Валерьевич

5. ВЫВОДЫ

1. Разработана информационная система - база знаний, обеспечивающая интегрированную платформу для хранения и анализа информации о структурно-функциональных особенностях белков надсемейства цитохромов Р450.

2. В составе базы знаний реализованы оригинальные методы обработки информационного массива, в том числе:

-методы выявления релевантных информационных объектов;

-методы оценки достоверности алгоритмов, основанных на сравнении первичных структур белков;

-метод автоматической классификации надсемейства белков;

Разработана и апробирована технология применения этих методов при осуществлении различных проектов НИР.

3. С использованием базы знаний получены следующие результаты: -разработаны подходы к инвентаризации (классификации) надсемейства цитохромов Р450;

-метод индексации предложен в качестве объективного способа упорядочивания белков надсемейства по степени их родства с реконструируемыми консенсусами-предшественниками;

-установлено, что последовательностям белков надсемейства цитохромов Р450 присущи мотивы двух типов: мотивы общего характера, обеспечивающие единство фолда и механизмов катализа, и мотивы частного характера, обеспечивающие специфичность функциональной активности.

4. Предложен новый подход к классификации белков надсемейства цитохромов Р450, основанный на анализе мотивов общего и частного характера в первичных структурах этих белков.

5. Показано, что общая тенденция накопления данных в отношении надсемейства характеризуется прогрессирующим отставанием объема сведений о функциональной активности от объема информации о расшифрованных генах, кодирующих цитохромы Р450. Задача прогнозирования функциональной активности новых форм определена как основная проблема в дальнейшем развитии биоинформационных исследований в области надсемейства цитохромов Р450.

6. СПИСОК НАУЧНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Archakov A.I., Ivanov A.S., Lisitsa A.V., Rukavishnikov I.G. Leucine clusters (L) 3+N as sites of interaction of microsomal cytochromes P450 with the membrane phospholipids. //In: Proceedings of 7-th International Conference "Biochemistry & Biophysics of cytochrome P450: Structure & Function, Biotehnology & Ecological Aspekts. (Archakov A.I., Bachmanova G.I., eds).-INCO-TNC Joint Stock Company.-1992.-P.716-718.

2. Archakov A.I., Bachmanova G.I., Sandler M.K., Tutochkin I.Y., Lisitsa A.V. Cytochrome P450 database and its scientific application. //In: Proceedings of 7-th International Conference "Biochemistry & Biophysics of Cytochrome P450: Structure & Function, Biotehnology & Ecological Aspekts. (Archakov A.I., Bachmanova G.I., eds).-INCO-TNC Joint Stock Company.-1992.-P.-673-679.

3. Archakov A.I., Degtyarenko K.N., Lisitsa A.V. Common motifs in microsomal cytochrome P450 N-terminal membrane fragment of cytochrome P450 LM2. //J. Basic & Clinical Physiology & Pharmacology.-1992.-P.97-98.

4. Lisitsa A.V., Bachmanova G.I., Archakov A.I. Cytochrome P450 database for prediction of drugs fate in living systems. //In: Abstr. 9-th International Conference "Cytochrome P450: Biochemistry, Biophysics and Molecular Biology".-Zarich.-l 995.-P.173.

5. Archakov A.I., Bachmanova G.I., Lisitsa A.V., Sandler M.K. Prediction of drugs fate by using cytochrome P450 database. //In: Abstr. of 3-th IUBMB Company Molecular Recognition.-Singapore.-1995.-P. 103.

6. Archakov A.I., Lyashenko A.A., Lisitsa A.V., Koymans L. Cytochrome P450 database and its usage for analysis of structural functional domains and substrate specificity. //Exp. Toxic. Pathol.-1996.-V.48(5).-P.329-330.

7. Archakov A.I., Lisitsa A.V., ZgodaV.G., Koymans L. The determination of the cytochrome P450 superfamily frontiers. //In: Abstr. 12-th International symposium on microsomes and drug oxidations.-Montpellier France Le Corum.-1998.-P.419.

8. Gusev S., Archakov A., Lisitsa A., Zgoda V., Koymans L. N-Tuple alignment of biological texts. IIIn: Abstr. 12-th International symposium on microsomes and drug oxidations.-Montpellier France Le Corum.-1998.-P.420.

9. Lisitsa A.V., Archakov A.I., Koymans L. Automatic procedure for the proteins clusterization applied to the cytochrome P450 superfamily. //In: Abstr. 12-th International symposium on microsomes and drug oxidations.-Montpellier France Le Corum.-1998.-P.421.

10. Archakov A.I., Lisitsa A. V., ZgodaV.G., Ivanov A.S., Koymans L. Clusterization of P450 superfamily using the objective pair alignment method and the UPGMA program. //J. Mol. Model.-1998.-V.4.-P.234-238.

11. Lisitsa A., Gusev S. Cytochrome P450 database and its scientific application. //In: Abstr. International workshop "From Sequence to function: Experimental and Bioinformatic Studies of Cytochrome P450 Superfamily".-Moscow.-2000.-P.21.

12. Gusev S., Lisitsa A. Creation of structural functional map for P450 proteins. //In: Abstr. International workshop "From Sequence to function: Experimental and Bioinformatic Studies of Cytochrome P450 Superfamily".-Moscow.-2000.-P.25.

13. Ivanov A., Dubanov A., Skvortsov V., Gusev S., Lisitsa A., Archakov A. Genome analysis and computer modelling of cytochromes P450 from Mycobacterium tuberculosis. //In: Abstr. International workshop "From Sequence to function: Experimental and Bioinformatic Studies of Cytochrome P450 Superfamily".-Moscow.-2000.-P.26.

14. Gusev S.A., Lisitsa A.V., Karuzina I.I., Archakov A.I. Cytochrome P450 Database. //In: Abstr. 13 International Symposium on Microsomes and Drug Oxidation.-Stresa-Italy.-Satellite Symposium of the VII World Conference on Clinical Pharmacology and Therapeutics.-Florence.-2000.-P.179.

15. Lisitsa A.V., Gusev S.A., Archakov A.I. Structural functional motifs in 14a-demethylase of Mycobacterium tuberculosis. //In: Abstr. 13 International Symposium on Microsomes and Drug Oxidation.-Stresa-Italy.-Satellite Symposium of the VII World Conference on Clinical Pharmacology and Therapeutics.-Florence.-2000.-P. 180.

16. Лисица A.B., Гусев С.А. Биоинформатика первичной структуры белков. //Вопросы мед. химии.-2001 .-Т.47.-С.659-663.

17. Archakov A., Lisitsa A., Gusev S., Koymans L., Janssen P. Inventory of the Cytochrome P450 superfamily. //J.Mol.Model.-2001.-V.7.-P.140-142.

18. Lisitsa A.V., Gusev S.A., Karuzina I.I., Archakov A.I., Koymans L. Cytochrome P450 database. //SAR QSAR Environ Res.-2001.-V.12(4).-P.359-66.

19. Lisitsa A.V., Gusev S.A., Archakov A.I. Application of protein indexing to Cytochrome P450 superfamily. //In: Abstr. 4-th International Conference on Molecular Structural Biology.-Vienna.-2001.-P.81.

20. Lisitsa A.V., Gusev S.A., Archakov A.I. Index of cytochrome P450 superfamily. /Дп: Abstr. 12-th International Conference on Cytochrome P450. Biochemistry, Biophysics and Molecular Biology.-France.-2001.-P. 102.

21.Shumyantseva V.V., Bulko T.V., Petushkova N.A., Lisitsa A.V., Archakov A.I. Specific binding of riboflavin to the cytochrome P450 2B4: fluorometric and spectroscopic studies. /Яn: Abstr. 12-th International Conference on Cytochrome P450. Biochemistry, Biophysics and Molecular Biology.-France.-2001.-P. 116.

22. Gusev S.A., Lisitsa A.V., Archakov A.I. Structural-functional motifs of cytochromes P450. //In: Abstr. 12-th International Conference on Cytochrome P450. Biochemistry, Biophysics and Molecular Biology.-France.-2001.-P. 119.

23. Archakov A.I., Lisitsa A.V., Gusev S.A., Govorun V.M. Proteomic indexing of Cytochrome P450 Superfamily. //In: Abstr. International Meeting on Proteome Analysis.-Munchen.-2001 .-P. 133.

24. Lisitsa A.V. Cytochrome P450 Database: From data to knowledge. //In: Abstr. International Conference Genomics and Bioinformatics for Medicine.-St.Peterburg-Moscow.-2002.-P.52.

25.Borodina Ju.V., Lisitsa A.V., Poroikov V.V., Filimonov D.A, Sobolev B.N., Archakov A.I. If there exists correspondence between similarity of substrates and protein sequences in cytochrome P450 superfamily? //In: Abstr. International

Conference Genomics and Bioinformatics for Medicine.-StPeterburg-Moscow.

2002.-P.76.

26.Archakov A.I., Karuzina I.I., Petushkova N.A., Lisitsa A.V., Zgoda V.G. Production of carbon monoxide by cytochrome P450 during iron-dependent lipid peroxidation. //Toxicology in vitro.-2002.-V.16.-P.l-10.

27. Lisitsa A., Borodina Ju., Filimonov D., Archakov A. Cytochrome P450 Database: from data to knowledge. //In: Abstr. 14th International Symposiun in Microsomes and Drug Oxidation.-Sapporo Japan.-2002.-P.84.

28. Лисица A.B., Мирошниченко Ю.В., Иванов A.C., Арчаков А.И. Общее и частное в структурной организации белков надсемейства цитохромов Р450. //Аллергия, астма и клиническая иммунология.-2003.-№8.-С.14-19.

29. Пономаренко Е.А., Лисица А.В., Карузина И.И., Мирошниченко Ю.В. Автоматизированное аннотирование функциональных свойств белков надсемейства цитохромов Р450. //Аллергия, астма и клиническая иммунология.-2003.-№8 .-С .95-99.

30.Арчаков А.И., Канаева И.П., Петушкова Н.А., Згода В.Г., Лисица А.В., Карузина И.И. Создание протеомных карт белков микросом клеток печени и лимфоцитов крови мышей с целью разработки новых диагностических тестов. //Аллергия, астма и клиническая иммунология.-2003.-№9.-С. 179-181.

31. Иванов А.С., Скворцов B.C., Сеченых А.А., Дубанов А.В., Лисица А.В. Компьютерное моделирование трехмерной структуры цитохрома Р450. //Биомедицинская химия.-2003.-Т.49(3).-С.221-37.

32. Borodina Y.V., Lisitsa A.V., Poroikov V.V., Filimonov D.A., Sobolev B.N., Archakov A.I. If there Exists Correspondence between Similarity of Substrates and Protein Sequences in Cytochromes P450 Superfamily? //Nova Acta Heopoldina.-2003 .-V.329.-P.47-55.

33. Archakov A.I., Lisitsa A.V., Gusev S.A., Miroshnichenko Yu.V. Bioinformatic Insight into the Structural Unity and Diversity of Cytochromes P450. //In: Proceedings 13-th International Conference on Cytochromes P450.-Prague.

2003.-P.7-13.

34.Ivanov A.S., Skvortsov V.S., Lisitsa A.V., Archakov A.I. General trends in 3D modelling of cytochromes P450. /Лп: Proceedings 13-th International Conference on Cytochromes P450.-Prague.-2003.-P.47-54.

35. Lisitsa A.V, Ponomarenko E.A., Karuzina I.I., Ivanov A.S., Archakov A.I. Balance Sheet for Cytochrome P450 Knowledgebase. /Лп: Proceedings 13-th International Conference on Cytochromes P450.-Prague.-2003.-P.67-73.

36. Lisitsa A.V., Gusev S.A., Archakov A.I. Motif-based criterion corrects the clustering of protein sequences. //In: Abstr. 5th International Conference on Molecular Structural Biology.-Vienna.-2003.-P.79.

37. Lisitsa A.V., Archakov A.I., Lewi P., Janssen P. Bioinformatic insight into the unity and diversity of cytochromes P450. //Methods aid Findings in Experimental and Clinical Pharmacology.-2003.-V.25(9).-P.733-745.

38. Иванов A.C., Скворцов B.C., Сеченых А.А., Дубанов A.B., Лисица A.B. Проблемы и перспективы компьютерного моделирования трехмерной структуры цитохромов Р450. //Сборник материалов Сессии ИВТН-2003.-Москва. -2003 .-С .6-7.

39. Иванов Н.А., Лисица А.В., Пономаренко Е.А., Арчаков А.И. Тематический анализ резюме научных публикаций в области цитохромов Р450. //Сборник материалов Сессии ИВТН-2003.-Москва.-2003.-С.28-29.

40. Lisitsa A.V., Archakov A.I. Bioinformatics of protein primary structure. //In: Annals of the European Academy of Sciences. Khalatnikov I.M. (Ed). EAS Publishing House: Brussels.-2003.-P. 48-74.

41. Лисица A.B., Мирошниченко Ю.В., Пономаренко E.A. База знаний по цитохромам Р450. //Сборник научных трудов X Российского национального конгресса «Человек и лекарство».-2003.-С.730.

42. Канаева И.П., Петушкова Н.А., Лохов П.Г., Згода В.Г., Карузина И.И., Лисица А.В., Арчаков А.А. Изучение микросом печени мышей с помощью методов протеомного анализа. //Биомедицинская химия.-2004.- Т.50(4).-С.367-75.

43. Lisitsa A.V. Bioinformatic means for the integration of heterogeneous data and methods. //In: Abstr. 2nd International conference "Genomics, Proteomics and Bioinformatics for Medicine".-Moscow-Ples-Moscow.-2004.-P.59.

44. Lisitsa A.V., Archakov A.I. Cytochrome P450 Knowledgebase (CPK). IIIn: Abstr. 7й1 International symposium on Cytochrome P450. Biodiversity and biotechnology.-Japan.-2004.-P.43.

45. Лисица A.B., Гусев C.A., Мирошниченко Ю.В., Кузнецова Г.П., Лазарев В.Н., Скворцов B.C., Карузина И.И., Говорун В.М., Арчаков А.И. Структурно-функциональные мотивы стероловых 14-альфа-деметилаз (CYP51). //Биомедицинская химия.-2004.-Т.50(6).-С.555-65.

46. Арчаков А.И., Гусев С.А., Лисица А.В. База данных по цитохромам Р450. //Свидетельство об официальной регистрации базы данных №2004620199,2004.

47. Kanaeva I.P., Petushkova N.A., Lisitsa A.V., Lokhov P.G., Zgoda V.G., Karuzina I.I., Archakov A.I. Proteomic and biochemical analysis of the mouse liver microsomes. //Toxicol In Vitro.-2005.-V.19(6).-P.805-12.

48. Арчаков А.И., Лисица А.В. Биоинформатика и биоинформационные технологии. //Труды XII Всероссийской научно-методической конференции «Телематика'2005».-Санкт-Петербург.-2005.-Т. 1 .-С.55-56.

49. Lisitsa A.V., Ponomarenko Е.А., Gusev S.A., Kuznetsova G.P., Karuzina I.I., Lewi P., Archakov A.I. Cytochrome P450 knowledgebase: structure and functionality. //In: Proceedings 14th International conference on cytochromes P450: biophysics and bioinformatics.-Dallas, USA.-2005.-P.29-34.

50. Lisitsa A.V. Integrated management of dataflow within the proteomic projects. //In: Abstr. HUPO 4th annual world congress "From defining the proteome to understanding function".-Munich, Germany.-2005.-P.83.

51. Петушкова H.A., Канаева И.П., Шереметьева Г.Ф., Згода В.Г., Лохов П.Г., Лисица А.В., Карузина И.И., Арчаков А.И. Использование протеомных технологий для выявления и идентификации цитохромов Р450 микросом клеток печени человека. Аллергия, астма и клиническая иммунология.

2005.-№5.-С.11-17.

52.Пономаренко Е.А., Лисица А.В., Карузина И.И., Гусев С.А. База знаний по цитохромам Р450. //Сборник материалов Сессии ИВТН-2006.-Москва.

2006.-С.32.

53.Шумянцева В.В., Булко Т.В., Рудаков Ю.О., Саменкова Н.Ф., Лисица А.В., Карузина И.И., Арчаков А.И. Наноэлектрохимия цитохромов Р450: прямой перенос электронов и электрокатализ. //Биомедицинская химия.-2006.-Т.52(5).-С.458-68.

54. Ivanov A.S., Gnedenko O.V., Molnar А.А., Mezentsev Yu.V., Lisitsa A.V., Archakov A.I. Protein-protein interactions as new targets for drug design: interactive links between virtual and experimental approaches. /Лп: Abstr. 5rd International conference on bioinformatics of genome regulation and structure.-Novosibirsk.-2006.-V. 1 .-P.277-281.

55. Petushkova N.A., Kanaeva I.P., Lisitsa A.V., Sheremetyeva G.F., Zgoda V.G., Samenkova N.F., Karuzina I.I., Archakov A.I. Characterization of human liver cytochromes P450 by combining the biochemical and proteomic approaches. //Toxicol In Vitro.-2006.-V.20(6).-P.966-74.

56. Zgoda V., Tikhonova 0., Lisitsa A., Archakov A. Proteomic profiles of induced hepatotoxicity at the subcellular level. /Лп: Abstr. 3rd International conference "Genomics, proteomics, bioinformatics and nanotechnologies for medicine".-Novosibirsk.-2006.-P.65.

57. Archakov A., Lisitsa A. Platform from genomes to drugs - escorting the data-driven drug design. //In: Abstr. 3rd International conference "Genomics, proteomics, bioinformatics and nanotechnologies for medicine".-Novosibirsk.-2006.-P.72.

58. Ivanov A., Molnar A., Lisitsa A., Archakov A. Integration of computer and experimental approaches for discovery of inhibitors of protein interactions. //In: Abstr. 3rd International conference "Genomics, proteomics, bioinformatics and nanotechnologies for medicine".-Novosibirsk.-2006.-P.77.

59. Zgoda V., Tikhonova O., Lisitsa A., Archakov A. Proteomic profiles of induced hepatotoxicity at the subcellular level. //In: Abstr. HUPO 5rd annual world congress.-Long Beach, California.-2006.-P.145.

60. Lisitsa A., Nikitin I., Archakov A., Podoplelov A., Thiele H. Recognizing the proteomic patterns of induced toxicity with 1D-ZOOMER approach. //In: Abstr. HUPO 5rd annual world congress.-Long Beach, California.-2006.-P.146.

61. Арчаков А.И., Лисица A.B., Пятницкий M.A., Руденко В.А., Тихонова О.В. Протей. //Свидетельство об официальной регистрации программы для ЭВМ №2006611941.-2006.

62. Zgoda V., Tikhonova О., Viglinskaya A., Serebriakova М., Lisitsa A., Archakov A. Proteomic profiles of induced hepatotoxicity at the subcellular level. //Proteomics.-2006.-V.6(16).-P.4662-4670.

Список литературы диссертационного исследования доктор биологических наук Лисица, Андрей Валерьевич, 2007 год

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. (1983). Прикладная статистика. Основы моделирования и первичная обработка данных. Москва, Финансы и статистика. 1:471.

2. Арчаков А.И. (1975). Микросомальное окисление. М., Наука.

3. Астахова Т.В., Олейникова М.А., Ройтберг М.А. (2002). Сравнительный анализ информационных биополимеров. //В кн.: Компьютеры и суперкомпьютеры в биологии (под ред. Лахно В.Д. и Устинина М.Н.). Москва-Ижевск, Институт компьютерных исследований. 449-457.

4. Блюменфельд Л.А. (1977). Проблемы биологической физики. М., Наука.

5. Бородовский М.Ю., Певзнер П.А. (1990). Статистические методы анализа генетических текстов. //В кн.: Компьютерный анализ генетических текстов. Москва, Наука. 36-80.

6. Волькенштейн М.В. (1986). Энтропия и информация. Москва, Наука.

7. Гусев С.А. (2002). Структурно-функциональные мотивы в последовательностях цитохромов Р450. //Диссертация на соискание ученой степени кандидата биологических наук. ГУ НИИ БМХ РАМН им. В.Н. Ореховича, Москва.

8. Дегтяренко К.Н. (1992). Множественное выравнивание и анализ гомологии в надсемействе Р450. //Диссертация на соискание ученой степени кандидата биологических наук. Институт биологической и медицинской химии, Москва.

9. Иванов A.C., Скворцов B.C., Сеченых A.A., Дубанов A.B., Лисица A.B. (2003). Компьютерное моделирование трехмерной структуры цитохрома Р450. //Биомедицинская химия. 49:221-37.

10. Лисица A.B. (2002). Протеомный индекс надсемейства цитохромов Р450. //Диссертация на соискание ученой степени кандидата биологических наук. ГУ НИИ БМХ РАМН им. В.Н. Ореховича, Москва.

11. Лисица A.B., Гусев С.А., Мирошниченко Ю.В., Кузнецова Г.П., Лазарев В.Н., Скворцов B.C., Карузина И.И., Говорун В.М., Арчаков А.И. (2004). Структурно-функциональные мотивы стероловых 14-альфа-деметилаз (CYP51). // Биомедицинская химия. 6:555-567.

12. Лисица A.B., Мирошниченко Ю.В., Иванов A.C., Арчаков А.И. (2003). Общее и частное в структурной организации белков надсемейства цитохромов Р450. //Аллергия, астма и клиническая иммунология. 8:14-19.

13. Мирошниченко Ю.В. (2006). Общее и частное в структурной организации белков надсемейства цитохромов Р450. //Диссертация на соискание ученой степени кандидата биологических наук. ГУ НИИ БМХ РАМН им. В.Н. Ореховича, Москва.

14. Рубин А.Б. (2004). Биофизика в 2-х томах. Т.1: Теоретическая биофизика: Учебник. Москва: МГУ, Наука. Глава 3.

15. Филимонов Д.А., Поройков В.В. (2006). Прогноз спектра биологической активности органических соединений. //Российский Химический Журнал. 2: 66-75.

16. Фоменко А.Е., Соболев Б.Н., Филимонов Д.А., Поройков В.В. (2003). Применение структурных MNA дескрипторов для построения профилей белковых семейств. //Биофизика. 48:595-605.

17. Черныш М.Ф. (2000). Опыт применения кластерного анализа. //Социология: 4М. 12:129-141.

18. Яцкив И., Гусарова JI. (2003). Методы определения количества кластеров при классификации без обучения. //Transport and Telecommunication. 4:23-28.

19. Abagyan R.A., Batalov S. (1997). Do aligned sequences share the same fold? //J. Mol. Biol. 273:355-368.

20. Abecassis V., Urban P., Truan G., Pompon D. (2003). Exploration of natural and artificial sequence spaces: towards a functional remodelling of membrane-bound cytochrome P450s. //Biocatalysis and Biotransformation. 21:55-66.

21. Al-Shahrour F., Minguez P., Vaquerizas J.M., Conde L., Dopazo J. (2005). BABELOMICS: a suite of web tools for functional annotation and analysis of groups of genes in high-throughput experiments. //Nucleic Acids Res. 33:W460-4.

22. Altschul S.F. (1998). Generalized affine gap costs for protein sequence alignment. //Proteins. 32:88-96.

23. Altschul S.F., Bundschuh R., Olsen R, Hwa T. (2001). The estimation of statistical parameters for local alignment score distributions. //Nucleic Acids Res. 29:351-61.

24. Altschul S.F., Erickson B.W. (1985). Significance of nucleotide sequence alignments: a method for random sequence permutation that preserves dinucleotide and codon usage. //Mol. Biol. Evol. 2:526-38.

25. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. (1990). Basic local alignment search tool. //J. Mol. Biol. 215:403-10.

26. Ananko E.A., Podkolodny N.L., Stepanenko I.L., Podkolodnaya O.A., Rasskazov D.A., Miginsky D.S., Likhoshvai V.A., Ratushny A.V., Podkolodnaya N.N., Kolchanov N.A. (2005). GeneNet in 2005. //Nucleic Acids Res. 33:D425-7.

27. Andrade M.A., Valencia A. (1998). Automatic extraction of keywords from scientific text: application to the knowledge domain of protein families. //Bioinformatics. 14:600-607.

28. Archakov A.I., Bachmanova G.I. (1990). Cytochrome P450 and Active Oxygen. Taylor & Francis, 339.

29. Archakov A.I., Degtyarenko K.N. (1993). Structural classification of the P450 superfamily based on consensus sequence comparison. //Biochem Mol Biol Int. 31:1071-80.

30. Archakov A.I., Lisitsa A.V., Zgoda V.G., Ivanova M.S., Koymans L. (1998). Clusterization of P450 superfamily using the objective pair alignment method and the UPGMA program. //J. Mol. Model. 4:234-238.

31. Ashburner M., Ball C.A., Blake J.A., Botstein D., Butler H., Cherry J.M., Davis A.P., Dolinski K., Dwight S.S., Eppig J.T. (2000). Gene Ontology: tool for the unification of biology. //Nature Genet. 25:25-29.

32. Attwood T.K. (2001). A compendium of specific motifs for diagnosing GPCR subtypes. //Trends Pharmacological Sci. 22:162-165.

33. Attwood T.K., Bradley P., Flower D.R., Gaulton A., Maudling N., Mitchell A.L., Moulton G., Nordle A., Paine K., Taylor P., Uddin A., Zygouri C. (2003). PRINTS and its automatic supplement, prePRINTS. //Nucleic Acids Res. 31:400-402.

34. Bader G.D., Betel D., Hogue C.W. (2003). BIND: the Biomolecular Interaction Network Database. //Nucleic Acids Res. 31:248-50.

35. Bairoch A. (2000). The ENZYME database in 2000. //Nucleic Acids Res. 28:304305.

36. Barney B.M. (2006). Classification of proteins based on minimal modular repeats: lessons from nature in protein design. //J. Proteome Res. 5:473-82.

37. Benson D.A, Karsch-Mizrachi I., Lipman D.J., Ostell J., Wheeler D.L. (2006). GenBank. //Nucleic Acids Res. 34:16-20.

38. Berger M.P., Munson P.J. (1991). A novel randomized iterative strategy for aligning multiple protein sequences. //Comput Appl Biosci. 7:479-84.

39. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N., Bourne P.E. (2000). The Protein Data Bank. //Nucleic Acids Res. 28:235-42.

40. Bernhardt R. (2004). Optimized chimeragenesis; creating diverse p450 functions. //Chem Biol. 11:287-8.

41. Bhat T.N., Bourne P., Feng Z., Gilliland G., Jain S., Ravichandran V., Schneider B., Schneider K., Thanki N., Weissig H., Westbrook J., Berman H.M. (2001). The PDB data uniformity project. //Nucleic Acids Res. 29:214-218.

42. Blaschke C., Andrade M.A., Ouzounis C., Valencia A. (1999). Automatic extraction of biological information from scientific text: Protein-protein interactions. //International Conference on Intelligent Systems for Molecular Biology. 7:60-67.

43. Boguski M.S., Lowe T.M., Tolstoshev C.M. (1993). dbEST—database for "expressed sequence tags". //Nature Genet. 4:332-333.

44. Borodina Yu., Sadym A., Filimonov D., Blinova V., Dmitriev A., Poroikov V. (2003). Predicting biotransformation potential from molecular structure. J. Chem. Inform. //Comput. Sci. 43:1636-1646.

45. Brooks B.R. (1983). CHARMM: A program for macromolecular energy, minimization, and dynamics calculations. //J. of Computational Chemistry. 4:187217.

46. Bucher P., Bairoch A. (1994). A generalized profile syntax for biomolecular sequence motifs and its function in automatic sequence interpretation. //Proc Int Conf Intell Syst Mol Biol. 2:53-61.

47. Bucher P., Karplus K., Moeri N., Hofmann K. (1996). A flexible motif search technique based on generalized profiles. //Comput. Chem. 20:3-23.

48. Burrage K., Hood L., Ragan M.A. (2006). Advanced computing for systems biology. //Brief Bioinform. 7:390-8.

49. Chakrabarti S., Van den Berg M., Dom B. (1998). Focused crawling: A new approach to topic-specific web resource discovery. //Proc. of the WWW-8, May.

50. Chefson A., Auclair K. (2006). Progress towards the easier use of P450 enzymes. //Mol Biosyst. 2:462-9.

51. Cohen M.B., Feyereisen R.(1995). A cluster of cytochrome P450 genes of the CYP6 family in the house fly. DNA Cell Biol. 14:73-82.

52. Cowie J., Lehnert W. (1996). Information Extraction. //Communications of the ACM. 39:80-91.

53. Davies D.L., Bouldin D.W. (1979). A cluster separation measure. //Pattern Anal. Machine Intell. 1:224-227.

54. Dayhoff M.O., Barker W.C., Hunt L.T. (1983). Establishing homologies in protein sequences. //Methods Enzymol.91:524-545.

55. Dayhoff M.O., Schwartz R.M., Orcutt B.C. (1978). In Atlas of Protein Sequence and Structure (ed. M.O. Dayhoff, ed.). National Biomedical Research Foundation, Washington, DC. 3:345.

56. Degtyarenko K.N., Archakov A.I. (1993). Molecular evolution of P450 superfamily and P450-containing monooxygenase systems. //FEBS Lett. 332:1-8.

57. Deken J. (1983). Probabilistic behavior of longest-common-subsequence length. //In Time Warps, String Edits and Macromolecules: The Theory and Practice of Sequence Comparison. Sankoff D., Kruskal J.B. (eds.). Addison-Wesley, Reading MA., 55-91.

58. Dembo A., Karlin S., Zeitouni O. (1994). Limit distribution of maximal non-aligned two-sequence segmental score. //Ann. Prob. 22:2022-2039.

59. Doolittle R.F. (1986). Of URFs and ORFs: a primer On How To Analyze derived amino acid sequences. University Science Books, Mill Valley, California.

60. Efron B., Halloran E., Holmes S. (1996). Bootstrap confidence levels for phylogenetic trees. //Proc Natl Acad Sci USA. 93:13429-34.

61. Eggertsen G., Olin M., Andersson U., Ishida H., Kubota S., Hellman U., Okuda K.I., Bjorkhem I. (1996). Molecular cloning and expression of rabbit sterol 12alpha-hydroxylase. //J. Biol Chem. 271:32269-75.

62. Eisen J.S. (1998). Genetic and molecular analyses of motoneuron development. //Curr OpinNeurobiol. 8:697-704.

63. Ekins S., Bravi G., Wikel J.H., Wrighton S.A. (1999). Three-dimensional-quantitative structure activity relationship analysis of cytochrome P-450 3A4 substrates. //J. Pharmacol. Exp. Ther. 291:424-33.

64. Ekins S., Wrighton S.A. (2001). Application of in silico approaches to predicting drug-drug interactions. //J. Pharmacol. Toxicol. Methods. 45:65-9.

65. Estabrook R.W. (2003). A passion for P450s (rememberances of the early history of research on cytochrome P450). //Drug Metab. Dispos. 31:1461-73.

66. Etzold T., Ulyanov A.V., Argos P. (1996). SRS: information retrieval system for molecular biology data banks. //Methods Enzymol. 266:114-128.

67. Fabian P., Degtyarenko K.N. (1997). The directory of P450-containing systems in 1996. //Nucleic Acids Research. 25:274-277.

68. Felsenstein J. (1988). Phylogenies from molecular sequences: inference and reliability. //Annu. Rev. Genet. 22:521-565.

69. Feng D.F., Doolittle R.F. (1987). Progressive sequence alignment as a prerequisite to correct phylogenetic trees. //J. Mol. Evol. 25:351-60.

70. Filimonov D., Poroikov V., Borodina Yu., Gloriozova T. (1999). Chemical Similarity Assessment through multilevel neighborhoods of atoms: definition and comparison with the other descriptors. //J. Chem. Inf. Comput. Sci. 39:666-670.

71. Fitch W.M. (1970). Distinguishing homologous from analogous proteins. //Systematic Zoology. 19:99-106.

72. Fitch W.M. (1983). Random sequences. //J. Mol. Biol. 163:171-6.

73. Fitch W.M. (2000). Homology a personal view on some of the problems. //Trends Genet. 16:227-231.

74. Fleischmann W., Moller S., Gateau A., Apweiler R (1999). A novel method for automatic functional annotation of proteins. //Bioinformatics. 15:228-233.

75. FlyBase Consortium (1994). FlyBase the Drosophila database. //Nucleic Acids Res. 22:3456-3458.

76. FlyBase Consortium (2003). The FlyBase database of the Drosophila genome projects and community literature. //Nucleic Acids Res. 31:172-175.

77. Fogleman J.C. (2000). Response of Drosophila melanogaster to selection for P450-mediated resistance to isoquinoline alkaloids. //Chem. Biol. Interact. 125:93-105.

78. Fomenko A.E., Filimonov D.A., Sobolev B.N., Poroikov V.V. (2006). New approach to predict enzyme function without the alighnment. //OMICS: A Journal of Integrative Biology. 10:56-65.

79. Fukuda K., Tsunoda T., Tamura A., Takagi T. (1998). Toward information extraction: identifying protein names from biological papers. //Pac. Symp. Biocomput., 707-718.

80. Gaizauskas R., Wilks Y. (1998). Information Extraction: Beyond Document Retrieval. Journal of Documentation. 54:70-105.

81. Garcia C.A, Chen Y.P., Ragan M.A. (2005). Information integration in molecular bioscience. //Appl Bioinformatics. 4:157-73.

82. Gasteiger E., Gattiker A., Hoogland C., Ivanyi I., Appel R.D., Bairoch A. (2003). ExPASy: The proteomics server for in-depth protein knowledge and analysis. //Nucleic Acids Res. 31:3784-8.

83. Gattiker A., Gasteiger E., Bairoch A. (2002). ScanProsite: a reference implementation of aPROSITE scanning tool. //Applied Bioinform. 1:107-108.

84. Gell-Mann M. (1994). A child learning the language: Algorithmic complexity and informational content. //The quark and the jaguar: adventures in the simple and the complex. W.H. Freeman and Company: New York, 58-60.

85. Gilardi G., Meharenna Y.T., Tsotsou G.E., Sadeghi S.J., Fairhead M., Giannini S. (2002). Molecular Lego: design of molecular assemblies of P450 enzymes for nanobiotechnology. //Biosens Bioelectron. 17:133-45.

86. Gonzalez F.J., Gelboin H.V. (1992). Human cytochromes P450: evolution and cDNA-directed expression. //Environ Health Perspect. 98:81-85.

87. Goto S., Nishioka T., Kanehisa M. (1998). LIGAND: chemical database for enzyme reactions. //Bioinformatics. 14:591-599.

88. Gotoh O. (1990). Consistency of optimal sequence alignments. //Bull Math Biol. 52:509-25.

89. Gotoh O. (1992). Substrate recognition sites in cytochrome P450 family 2 (CYP2) proteins inferred from comparative analyses of amino acid and coding nucleotide sequences. //J. Biol. Chem. 267:83-90.

90. Gotoh O. (1993). Optimal alignment between groups of sequences and its application to multiple sequence alignment. Comput Appl Biosci. 9:361-70.

91. Gotoh O. (1999). Multiple sequence alignment: algorithms and applications. //Adv. Biophys. 36:159-206.

92. Gotoh O. (2000). Homology-based gene structure prediction: simplified matching algorithm using a translated codon (tron) and improved accuracy by allowing for long gaps. //Bioinformatics. 16:190-202.

93. Graham S.E., Peterson J.A. (2002). Sequence alignments, variabilities, and vagaries. //Methods Enzymol. 357:15-28.

94. Gribskov M., Luthy R., Eisenberg D. (1990). Profile analysis. //Methods Enzymol. 183:146-159.

95. Gribskov M., McLachlan A.D., Eisenberg D. (1987). Profile analysis: detection of distantly related proteins. //Proc. Natl. Acad. Sci. USA. 84:4355-4358.

96. Guengerich F.P. (1992). Characterization of human cytochrome P450 enzymes. //FASEB J. 6:745-8.

97. Guex N., Peitsch M.C. (1997). SWISS-MODEL and the Swiss-PdbViewer: An environment for comparative protein modeling. //Electrophoresis. 18:2714-2723.

98. Gumbel EJ. (1958). Statistics of extremes. Columbia Iniversity Press, New York, NY.

99. Gunsalus I.C., Pederson T.C., Sligar S.G. (1975). Oxygenase-catalyzed biological hydroxylations. IIAram. Rev. Biochem. 44:377-407.

100. Halkidi M., Batistakis Y., Vazirgiannis (2001). On clustering Validation Techniques.//Journal of Intelligent Information Systems. 17:107-145.

101. Harris T., Lee R., Schwarz E., Bradnam K., Lawson D., Chen W., Blasier D., Kenny E., Cunningham F., Kishore R. (2003). WormBase: a cross-species database for comparative genomics. //Nucleic Acids Res. 31:133-137.

102. Hayaishi O. (1974). Molecular Mechanisms of 02 Activation. Academic, New York.

103. Heinemann M., Panke S. (2006). Synthetic biology-putting engineering into biology. //Bioinformatics. 22:2790-9.

104. Henikoff S., Greene E.A., Pietrokovski S., Bork P., Attwood T.K., Hood L. (1997). Gene families: the taxonomy of protein paralogs and chimeras. //Science. 278:609-614.

105. Henikoff S., Henikoff J.G. (1992). Amino acid substitution matrices from protein blocks. //Proc. Natl. Acad. Sci. USA. 89:10915-9.

106. Henikoff S., Henikoff J.G. (1993). Performance evaluation of amino acid substitution matrices. //Proteins. 17:49-61.

107. Hersh W.R., Evans D.A., Monarch I.A., Lefferts R.G., Handerson S.K., Gorman P.N. (1992). Indexing Effectiveness of Linguistic and Non-Linguistic Approaches to Automatic Indexing. Elsevier Science Publishers, Amsterdam.

108. Higgins D.G., Bleasby A.J., Fuchs R. (1992). CLUSTAL V: improved software for multiple sequence alignment. //Comput. Appl. Biosci. 8:189-91.

109. Higgins D.G., Thompson J.D., Gibson T.J. (1996). Using CLUSTAL for multiple sequence alignments. //Methods Enzymol. 266:383-402.

110. Hoogland C., Sanchez J.-C., Tonella L., Binz P.-A., Bairoch A., Hochstrasser D.F., Appel R.D. (2000). The 1999 SWISS-2DPAGE database update. //Nucleic Acids Res. 28:286-288.

111. Hubbard T., Barker D., Birney E., Cameron G., Chen Y., Clark L., Cox T., Cuff J., Curwen V., Down,T. (2002). The Ensembl genome database project. //Nucleic Acids Res. 30:38-41.

112. Huynen M.A., Bork P. (1998). Measuring genome evolution. //Proc. Natl. Acad. Sci. USA. 95:5849-5856.

113. Ioannides C., Lewis D.F., Parke D.V. (1993). Computer modelling in predicting carcinogenicity. //Eur. J. Cancer Prev. 2:275-82.

114. Jonassen I., Collins J.F., Higgins D.G. (1995). Finding flexible patterns in unaligned protein sequences. //Protein Sci. 4:1587-95.

115. Kalinina O.V., Mironov A.A., Gelfand M.S., Rakhmaninova A.B. (2004a). Automated selection of positions determining functional specificity of proteins by comparative analysis of orthologous groups in protein families. //Protein Sci. 13:443-456.

116. Kalita M.K., Ramasamy G., Duraisamy S., Chauhan V.S., Gupta D. (2006). ProtRepeatsDB: a database of amino acid repeats in genomes. //BMC Bioinformatics. 7:336.

117. Kanehisa M. (1997). A database for post-genome analysis. //Trends Genet. 13:375-376.

118. Kanehisa M., Goto S. (2000). KEGG: kyoto encyclopedia of genes and genomes. //Nucleic Acids Res. 28:27-30.

119. Kanehisa M., Goto S., Hattori M., Aoki-Kinoshita K.F., Itoh M., Kawashima S., Katayama T., Araki M., Hirakawa M. (2006). From genomics to chemical genomics: new developments in KEGG. //Nucleic Acids Res. 34:D354-7.

120. Kanehisa M., Goto S., Kawashima S., Okuno Y., Hattori M. (2004). The KEGG resource for deciphering the genome. //Nucleic Acids Res. 32:D277-D280.

121. Kans J.A., Ouellette B.F.F. (2001). Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins. Baxevanis A., Ouellette B.F.F., editors. New York, NY: John Wiley and Sons, Inc.; 65-81.

122. Karlin S., Altschul S.F. (1990). Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. //Proc. Natl. Acad. Sci. USA. 87:2264-2268.

123. Karlin S., Brocchieri L., Bergman A., Mrazek J., Gentles A.J. (2002). Amino acid runs in eukaryotic proteomes and disease associations. //Proc. Natl. Acad. Sci. USA. 99:333-8.

124. Kimura M. (1983). The Neutral Theory of Molecular Evolution. Cambridge University Press, Cambridge, UK.

125. Kimura M. (1991). The neutral theory of molecular evolution: a review of recent evidence. //Jpn J. Genet. 66:367-86.

126. Kocsor A., Kertesz-Farkas A., Kajan L., Pongor S. (2006). Application of compression-based distance measures to protein sequence classification: a methodological study. //Bioinformatics. 22:407-12.

127. Kolchanov N.A., Ananko E.A., Kolpakov F.A., Podkolodnaya O.A., Ignateva E.V., Goiyachkovskaya T.N., Stepanenko I.L. (2000). Gene networks. //Mol. Biol. (Moskow). 34:449-460.

128. Krull M., Voss N., Choi C., Pistor S., Potapov A., Wingender E. (2003). TRANSPATH: an integrated database on signal transduction and a tool for array analysis. //Nucleic Acids Res. 31:97-100.

129. Kuralenok I., Dobiynin V., Nekrestyanov I., Bessonov M., Patel A. (1999). Distributed search in topic-oriented document collections. //Proc. of World Multiconference on Systemics, Cybernetics and Informatics (SCI'99). 4:377-383.

130. Lamb D.C., Fowler K., Kieser T., Manning N., Podust L.M., Waterman M.R., Kelly D.E., Kelly S.L. (2002). The cytochrome P450 complement (CYPome) of Streptomyces coelicolor A3(2). //J. Biol. Chem. 277:24000-5.

131. Laskin A.A., Kudiyashov N.A., Skryabin K.G., Korotkov E.V. (2005). Latent periodicity of serine-threonine and tyrosine protein kinases and other protein families. //Comput. Biol. Chem. 29:229-43.

132. Lau A.Y., Chasman D.I. (2004). Functional classification of proteins and protein variants. //Proc. Natl. Acad. Sci. USA. 101:6576-81.

133. Leinonen R., Nardone F., Zhu W., Apweiler R. (2006). UniSave: the UniProtKB sequence/annotation version database. //Bioinformatics. 22:1284-1285.

134. Lempel A., Ziv J. (1976). On the complexity of finite sequences. //IEEE Transactions on Information Theory. 22:75-81.

135. Lesk A.M. (1988). In Lesk AM (ed.) Computational Molecular Biology. Oxford University Press, Oxford, 17-26.

136. Levan G., Jacob H.J. (2006). Nomenclature of the rat Cyp genes and the problems of gene nomenclature in general. //Hum. Genomics. 2:343-4.

137. Lewi P.J., Moereels H., Adriaensen D. (1992). The combination of dendrograms with plots of latent variables. An application to G-protein coupled receptor sequences.//Chem. Intell. 16:145-54.

138. Lewis D., Jones K. (1996). Natural language processing for information retrieval. //Commun. ACM. 39:92-101.

139. Lewis D.F. (2003). Quantitative structure-activity relationships (QSARs) within the cytochrome P450 system: QSARs describing substrate binding, inhibition and induction of P450s. //Inflammopharmacology. 11:43-73.

140. Lewis D.F., Sheridan G. (2001). Cytochromes P450, oxygen, and evolution. //Scientific World Journal. 1:151 -67.

141. Lipman D.J., Wilbur W.J. (1984). Interaction of silent and replacement changes in eukaryotic coding sequences. Hi. Mol. Evol. 21:161-167.

142. Lisitsa A., Archakov A., Lewi P., Janssen P. (2003). Bioinformatic insight into the unity and diversity of cytochromes P450. //Methods and Findings in Experimental and Clinical Pharmacology. 25:733-745.

143. Lisitsa A.V., Gusev S.A., Karuzina I.I., Archakov A.I. and Koymans L. (2001). Cytochrome P450 Database. //SAR QSAR Environ Res. 12:359-366.

144. Liu X., Liu D., Qi J., Zheng W.M. (2002). Simplified amino acid alphabets based on deviation of conditional probability from random background. //Phys Rev E Stat Nonlin Soft Matter Phys. 66:021906.

145. Lo Conte L., Ailey B., Hubbard T.J., Brenner S.E., Murzin A.G., Chothia C. (2000). SCOP: a structural classification of proteins database. Nucleic Acids Res. 28:257-9.

146. Lopez P., Casane D., Philippe H. (2002). Heterotachy, an important process of protein evolution. //Mol. Biol. Evol. 19:1-7.

147. MacKerell A.D. Jr. (1998). All-atom empirical potential for molecular modeling and dynamics Studies of proteins. //Journal of Physical Chemistry. 102:3586-3616.

148. Mann HJ. (2006). Drug-associated disease: cytochrome P450 interactions. //Crit. Care. Clin. 22:329-45.

149. Mao B., Gozalbes R., Barbosa F., Migeon J., Merrick S., Kamm K., Wong E., Costales C., Shi W„ Wu C., Froloff N. (2006). QSAR modeling of in vitro inhibition of cytochrome P450 3A4. //J. Chem. Inf. Model. 46:2125-34.

150. Marcotte E.M., Xenarios I., Eisenberg D. (2001). Mining literature for proteinprotein interactions. //Bioinformatics. 17:359-63.

151. Matsunaga L., Yamada A., Lee D. S. (2002). Enzymatic reaction of hydrogen peroxide—dependent peroxygenase cytochrome P450s: kinetic deuterium isotope effects and analyses by resonance Raman spectroscopy. Biochemistry. 41:1886-1892.

152. McGinnis S., Madden T. (2004). BLAST: at the core of a powerful and diverse set of sequence analysis tools. //Nucleic Acids Res. 32:W20-W25.

153. McKusick V.A. (1998). Mendelian Inheritance in Man. Catalogs of Human Genes and Genetic Disorders. //12th edn. Baltimore, MD: The Johns Hopkins University Press.

154. Meyer M.M., Hochrein L., Arnold F.H. (2006). Structure-guided SCHEMA recombination of distantly related beta-lactamases. //Protein Eng. Des. Sel. 19:56370.

155. Mimy L.A., Gelfand M.S. (2002). Using orthologous and paralogous proteins to identify specificity-determining residues in bacterial transcription factors. //J. Mol. Biol. 321:7-20.

156. Moereels H., Lewi P.J., Koymans L.M., Janssen P.A. (1997). The alpha and omega of G protein-coupled receptors. A novel method for classification. //Ann. NY Acad. Sci. 812:147-8.

157. Morgenstern B. (1999). DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. //Bioinformatics. 15:211-218.

158. Mosteller F., Wallace D.L. (1984). Applied Bayesian and Classical Inference: the Case of the Federalist Papers. Springer, New York.

159. Mulder N., Apweiler R., Attwood T., Bairoch A., Barrell D., Bateman A., Binns D., Biswas M., Bradley P., Bork P. (2003). The InterPro Database, 2003 brings increased coverage and new features. //Nucleic Acids Res. 31:315-318.

160. Muppirala U.K., Li Z. (2006). A simple approach for protein structure discrimination based on the network pattern of conserved hydrophobic residues. //Protein Eng. Des. Sel. 19:265-75.

161. Murakami K., Mihara K., Omura T. (1994). The transmembrane region of microsomal cytochrome P450 identified as the endoplasmic reticulum retention signal. IIJ. Biochem (Tokyo). 116:164-75.

162. Nagarajan N., Jones N., Keich U. (2005). Computing the P-value of the information content from an alignment of multiple sequences. //Bioinformatics. I:i311-8.

163. Nebert D.W., Adesnik M., Coon M.J. (1987). The P450 gene superfamily: recommended nomenclature. //DNA. 6:1-11.

164. Nebert D.W., Jaiswal A.K., Meyer U.A., Gonzalez F.J. (1987). Human P-450 genes: evolution, regulation and possible role in carcinogenesis. //Biochem. Soc. Trans. 15:586-9.

165. Nebert D.W., Nelson D.R. (1991). P450 gene nomenclature based on evolution. //Methods Enzymol. 206:3-11.

166. Nebert D.W., Nelson D.R., Feyereisen R. (1989). Evolution of the cytochrome P450 genes. //Xenobiotica. 19:1149-1160.

167. Needleman S.B., Wunsch C.D. (1970). A general method applicable to the search for similarities in the amino acid sequence of two proteins. //J. Mol. Biol. 48:44353.

168. Nekrasov A.N. (2004). Analysis of the information structure of protein sequences: a new method for analyzing the domain organization of proteins. //J. Biomol. Struct. Dyn. 21:615-24.

169. Nekrestyanov I., O'Meara T., Romanova E. (1999). Building topic-specific collections with intelligent agents. Proc. //Of Sixth International Conference on Intelligence in Services and Networks (IS&N'99), Barcelona, Spain, April.

170. Nelson D.R. (1999). Cytochrome P450 and the individuality of species. //Arch. Biochem. Biophys. 369:1-10.

171. Nelson D.R. (2004). Frankenstein genes, or the Mad Magazine version of the human pseudogenome.//Hum. Genomics. 1:310-316.

172. Nelson D.R. (2005). Gene nomenclature by default, or BLASTing to Babel. //Hum Genomics. 2:196-201.

173. Nelson D.R., Strobel H.W. (1987). Evolution of cytochrome P-450 proteins. //Mol. Biol. Evol. 4:572-593.

174. Nelson DR. (2006). Cytochrome P450 nomenclature, 2004. //Methods Mol. Biol. 320:1-10.

175. Nenadic G., Mima H., Spasic I., Ananiadou S., Tsujii J. (2002). Terminology-driven literature mining and knowledge acquisition in biomedicine. //Int. J. Med. Inform. 67:33-48.

176. Ng S., Wong M. (1999). Toward Routine Automatic Pathway Discovery from Online Scientific Text Abstracts. //Genome Inform Ser Workshop Genome Inform. 10:104-112.

177. Pang H., Tang J., Chen S.S. (2005). Statistical distributions of optimal global alignment scores of random protein sequences. //BMC Bioinformatics. 6:257.

178. Papka R., Allan J. (1998). Document classification using multiword features. //Proc. Of the CIKM'98.124-131.

179. Peitsch M.C. (1995). Protein modelling by E-Mail. //Biotechnology. 13:658-660.

180. Peitsch M.C. (1997). Large scale protein modelling and model repository. //Proc. Int. Conf. Intell. Syst. Mol. Biol. 5:234-236.

181. Podust L.M., Poulos T.L., Waterman M.R. (2001). Crystal structure of cytochrome P450 14alpha -sterol demethylase (CYP51) from Mycobacterium tuberculosis in complex with azole inhibitors. //Proc. Natl. Acad. Sci. USA. 98:3068-73.

182. Proux D., Rechenmann F., Julliard L., Pillet V., Jacq B. (1998). Detecting Gene Symbols and Names in Biological Texts: A First Step toward Pertinent Information Extraction. //Genome Inform Ser Workshop Genome Inform. 9:72-80.

183. Pruitt K., Maglott D. (2001). RefSeq and LocusLink: NCBI gene-centered resources. //Nucleic Acids Res. 29:137-140.

184. Pruitt K., Tatusova T., Maglott D. (2005). Entrez Gene. //Nucleic Acids Res. 33:D54-D58.

185. Pruitt K.D., Tatusova T., Maglott D.R. (2005). NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. //Nucleic Acids Res. 33:D501-D504.

186. Raevsky O.A. (1997). Hydrogen Bond Strengtn Estimation by means of HYBOT. //In "Computer-Assisted Lead Finding and Optimization" eds H.Waterbeemd, B.Testa, G.Folkers, Basel: Verlag, 367-378.

187. Reich J.G., Drabsch H., Daumler A. (1984). On the statistical assessment of similarities in DNA sequences. //Nucl. Acids Res. 12:5529-5543.

188. Rendic S., Di Carlo F. (1997). Human Cytochrome P450 Enzymes: A status report summarizing their reactions, substrates, inducers and inhibitors. //Drug Metabolism Reviews. 29:413-580.

189. Rindflesch T.C., Tanabe L., Weinstein J.N., Hunter L. (2000). EDGAR: extraction of drugs, genes and relations from the biomedical literature. //Pac. Symp. Biocomput. 5:517-528.

190. Rodriguez-Tome P., Stoehr P.J„ Cameron G.N., Flores T.P. (1996). The European Bioinformatics Institute (EBI) databases. //Nucleic Acids Res. 24:6-12.

191. Saitou N., Nei M. (1987). The neighbor joining method: a new method for reconstructing phylogenetic trees. //Mol. Biol. Evol. 4:406-425.

192. Sali A., Potterton L., Yuan F., van Vlijmen H., Karplus M. (1995). Evaluation of comparative protein modeling by MODELLER. //Proteins. 23:318-26.

193. Salton G. (1989). Automatic Text Processing: the transformation, analysis and retrieval of information by computer. Reading, Mass. Addison Wesley.

194. Sawyer S. (1989). Statistical tests for detecting gene conversion. //Mol. Biol. Evol. 6:526-38.

195. Schuler G.D. (1997). Pieces of the puzzle: expressed sequence tags and the catalog of human genes. //J. Mol. Med. 75:694-698.

196. Schuler G.D., Epstein J.A., Ohkawa H., Kans J.A. (1996). Entrez: molecular biology database mid retrieval system. //Methods Enzymol. 266:141-162.

197. Schwab W. (2003). Metabolome diversity: too few genes, too many metabolites? //Phytochemistry. 62:837-49.

198. Scordis P., Flower,D.R. and Attwood,T.K. (1999). FingerPRINTScan: intelligent searching of the PRINTS motif database. //Bioinformatics. 15:799-806.

199. Scott E.E., He Y.Q., Halpert J.R. (2002). Substrate routes to the buried active site may vary among cytochromes P450: mutagenesis of the F-G region in P450 2B1. //Chem. Res. Toxicol. 15:1407-13.

200. Searls D.B. (2001). Reading the book of life. //Bioinformatics. 17:579-80.

201. Seifert A., Tatzel S., Schmid R.D., Pleiss J. (2006). Multiple molecular dynamics simulations of human p450 monooxygenase CYP2C9: the molecular basis of substrate binding mid regioselectivity toward warfarin. //Proteins. 64:147-55.

202. Sellers P.H. (1974). On the theory and computation of evolutionary distances. //SLAM J. Appl. 26:787-793.

203. Sellers P.H. (1984). Pattern recognition in genetic sequences by mismatch density. //Bull. Math. Biol. 46:501-514.

204. Shakhnovich E.I., Gutin A.V. (1990). Implication of Thermodynamics of Protein Folding for Evolution of Primary Sequences. //Nature. 346:773-775.

205. Sherman B. (1950). A random variable related to the spacing of sample values. //Ann. Math. Stat. 21:339-361.

206. Sherman B. (1957). Percentiles of the w(n) statistic. //Ann. Math. Stat. 28:259261.

207. Sheriy S.T., Ward M.H., Kholodov M., Baker J., Pham L., Smigielski E., Sirotkin K. (2001). dbSNP: The NCBI database of genetic variation. //Nucleic Acids Res. 29:308-311.

208. Shi J., Blundell T.L., Mizuguchi K. (2001). FUGUE: sequence-structure homology recognition using environment-specific substitution tables and structure-dependent gap penalties. //J. Mol. Biol. 310:243-57.

209. Shrager J. (2003). The fiction of function. //Bioinformatics. 19:1934-6.

210. Sigrist C.J.A., Cerutti L., Hulo N., Gattiker A., Falquet L., Pagni M., Bairoch A., Bucher P. (2002). PROSITE: a documented database using patterns and profiles as motif descriptors. //Briefings Bioinform. 3:265-274.

211. Simpson A.E. (1997). The cytochrome P450 4 (CYP4) family. Gen Pharmacol. 28:351-9.

212. Smith S.L., Bollenbacher W.E., Cooper D.Y., Schleyer., Weilgus J.J., Gilbert L.I. (1979). Ecdysone 20-monooxygenase: characterization of an insect cytochrome p-450 dependent steroid hydroxylase. //Mol. Cell. Endocrinol. 15:111-113.

213. Smith T.F., Waterman M.S. (1981). Identification of common molecular subsequences. //J. Mol. Biol. 147:195-7.

214. Smith T.F., Waterman M.S., Burks C. (1985). The statistical distribution of nucleic acid similarities. //Nucleic Acids Res. 13:645-656.

215. Sneath P.H.A. (1995). The distribution of the random division of a molecular sequence. //Binary. 7:148-152.

216. Sneath P.H.A. (1998). The effect of evenly spaced constant sites on the distribution of the random division of a molecular sequence. //Bioinformatics. 14:608-616.

217. Sneath P.H.A., Sokal RR. (1973). Numerical Taxonomy. San Francisco: W.H. Freeman.

218. Solovyev V.V., Makarova K.S. (1993). A novel method of protein sequence classification based on oligopeptide frequency analysis and its application to search for functional sites and to domain localization. //Comput. Appl. Biosci. 9:17-24.

219. Sonnhammer E.L., Eddy S.R., Birney E., Bateman A., Durbin R. (1998). Pfam: multiple sequence alignments aid HMM-profiles of protein domains. //Nucleic Acids Res. 26:320-322.

220. Sonnhammer E.L., Koonin E.V. (2002). Orthology, paralogy and proposed classification for paralog subtypes. //Trends Genet. 18:619-620.

221. Stata R., Bharat K., Maghoul F. (2000). The term vector database: fact access to indexing terms for web pages. //Proc.of the WWW-9, May.

222. Stoesser G., Baker W., van den Broek A., Garcia-Pastor M., Kanz C., Kulikova T., Leinonen R., Lin Q„ Lombard V., Lopez R. (2003). The EMBL Nucleotide Sequence Database: major new development. //Nucleic Acids Res. 30:21-26.

223. Sugiura A., Etzioni 0. (2000). Query routing for web search engines: Architecture and experiments. //Proc. Of the WWW-9, May.

224. Susko E., Field C., Blouin C., Roger AJ. (2003). Estimation of rates-across-sites distributions in phylogenetic substitution models. //Syst. Biol. 52:594-603.

225. Tatusov R.L., Fedorova N.D., Jackson J.D., Jacobs A.R., Kiryutin B., Koonin E.V., Kiylov D.M., Mazumder R., Mekhedov S.L., Nikolskaya A.N., Rao B.S. (2003). The COG database: an updated version includes eukaryotes. //BMC Bioinformatics. 4:41.

226. Tatusov R.L., Koonin E.V., Lipman D.J. (1997). A genomic perspective on protein families. //Science. 278:631-637.

227. Tatusova T., Karsch-Mizrachi I., Ostell J. (1999). Complete genomes in WWW Entrez: data representation and analysis. //Bioinformatics. 15:536-543.

228. Tatusova T.A., Madden T.L. (1999). BLAST 2 Sequences, a new tool for comparing protein and nucleotide sequences. //FEMS Microbiol. Lett. 174:247-50.

229. Taylor W.R. (1990). Hierarchical method to align large numbers of biological sequences, //Methods Enzymol. 183:456-474.

230. The International HapMap Consortium (2003). The International HapMap Project. //Nature. 426:789-796.

231. The UniProt Consortium. (2007). The Universal Protein Resource (UniProt). //Nucleic Acids Res. 35:D193-7.

232. Thomas J., Milward D., Ouzounis C., Pulman S., Carroll M. (2000). Automatic extraction of protein interactions from scientific abstracts. //Pac. Symp. Biocomput. 5:541-542.

233. Thompson J.D., Higgins,D.G., Gibson,T.J. (1994). CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. //Nucleic Acids Res. 22:4673-4680.

234. Turutina V.P., Laskin A.A., Kudiyashov N.A., Skiyabin K.G., Korotkov E.V. (2006). Identification of amino acid latent periodicity within 94 protein families. //J. Comput. Biol. 13:946-64.

235. Unno M., Shimada H., Toba Y., Makino R., Ishimura Y. (1996). Role of Argll2 of cytochrome p450cam in the electron transfer from reduced putidaredoxin. Analyses with site-directed mutants. //J. Biol. Chem. 271:17869-74.

236. Vinga S., Almeida J. (2003). Alignment-free sequence comparison-a review. //Bioinformatics. 19:513-23.

237. Wang Q., Halpert J.R. (2002). Combined three-dimensional quantitative structure-activity relationship analysis of cytochrome P450 2B6 substrates and protein homology modeling. //Drug Metab. Dispos. 30:86-95.

238. Waterman M.S. (1994). Parametric and ensemble sequence alignment algorithms. //Bull. Math. Biol. 56:743-67.

239. Waterman M.S., Vingron M. (1994). Rapid and accurate estimates of statistical significance for sequence data base searches. //Proc. Natl. Acad. Sci. USA. 91:4625-4628.

240. Webber C., Barton G.J. (2001). Estimation of P-values for global alignments of protein sequences. //Bioinformatics. 17:1158-67.

241. Werck-Reichhart D., Feyereisen R. (2000). Cytochromes P450: a success story. //Genome Biol. 1:REVIEWS3003.

242. Westbrook J., Feng Z., Chen L., Yang H., Berman H. (2003). The Protein Data Bank and structural genomics. //Nucleic Acids Res. 31:489-491.

243. Wieser D., Kretschmann E., Apweiler R. (2004). Filtering erroneous protein annotation. //Bioinformatics. 20:342-347.

244. Wilson C.A., Kreychman J., Gerstein M. (2000). Assessing annotation transfer for genomics: quantifying the relations between protein sequence, structure and function through traditional and probabilistic scores. //J. Mol. Biol. 297:233-249.

245. Wingender E. (1988). Compilation of transcription regulating proteins. //Nucleic Acids Res. 16:1879-1902.

246. Word J.M., Lovell S.C., Richardson J.S., Richardson D.C. (1999). Asparagine and glutamine: using hydrogen atom contacts in the choice of side-chain amide orientation. //J. Mol. Biol. 285:1733-1747.

247. Yamada S., Gotoh O., Yamana H. (2006). Related Articles, Links Improvement in accuracy of multiple sequence alignment using novel group-to-group sequence alignment algorithm with piecewise linear gap cost. //BMC Bioinformatics. 7:524.

248. Ye J., McGinnis S., Madden T.L. (2006). BLAST: improvements for better sequence analysis. //Nucleic Acids Res. 34:W6-9.

249. Zhao J., Goble C., Stevens R. (2004). Semantically linking and browsing provenance logs for e-science. //In First International Conference on Semantics of a Networked World. 157-174.

250. Zharkikh A., Li W.H. (1995). Estimation of confidence in phylogeny: the complete-and-partial bootstrap technique. //Mol. Phylogenet. Evol. 4:44-63.

251. Zharkikh A.A., Rzhetsky A.Yu. (1993). Quick assessment of similarity of two sequences by comparison of their L-tuple frequencies. //Biosystems. 30:93-111.1. БЛАГОДАРНОСТИ

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.