Разработка автоматизированных подсистем регистрации и классификации химико-структурных данных с использованием формул Маркуша в системе информационного обеспечения по проблемам химической безопасности тема диссертации и автореферата по ВАК РФ 05.25.05, кандидат технических наук Мартиросов, Александр Константинович

  • Мартиросов, Александр Константинович
  • кандидат технических науккандидат технических наук
  • 2005, Москва
  • Специальность ВАК РФ05.25.05
  • Количество страниц 168
Мартиросов, Александр Константинович. Разработка автоматизированных подсистем регистрации и классификации химико-структурных данных с использованием формул Маркуша в системе информационного обеспечения по проблемам химической безопасности: дис. кандидат технических наук: 05.25.05 - Информационные системы и процессы, правовые аспекты информатики. Москва. 2005. 168 с.

Оглавление диссертации кандидат технических наук Мартиросов, Александр Константинович

Введение.

1. Актуальность темы.

2. Задачи диссертации.

3. Научная новизна.

4. Практическая значимость.

5. Структура диссертации.

Глава 1. Состояние и основные тенденции крупных многоаспектных баз данных

БД) в области химии.

1.1. Проектирование и разработка крупных БД в области химии.

1.1.1 Современные крупные БД в области химии.

1.1.2 Основные задачи БД в области химии.

1.1.3 Разработка БД для информационных систем (ИС) в области химии.

1.1.4 Обзор инструментальных средств разработки БД.

1.2 Форматы представления химической информации.

1.3 Подходы к решению основных задач крупных БД в области химии.

1.3.1 Поиск/идентификация химических веществ.

1.3.2 Использование дескрипторов химических веществ.

1.3.3 Регистрация химических веществ в современных крупных БД.

1.3.4 Классификация химических веществ в современных крупных БД.

1.3.5 Синтез информации в БД.

1.4 Применение формул Маркуша в химических БД.

1.4.1 Родовые химические структуры (формулы Маркуша).

1.4.2 Применение формул Маркуша в патентных БД.

Глава 2. Программно-технологические решения регистрации и классификации химико-структурных данных для фактографической базы данных (БД) на основе применения формул Маркуша.

2.1 Задача разработки программно-технологических средств для регистрации и классификации химико-структурных данных в химической БД.

2.2 Программно-технологические решения для загрузки данных в БД.

2.3 Программно-технологические решения для идентификации/регистрации химических веществ.

2.4 Программно - технологические решения для поиска химических веществ.

2.5 Программно-технологические решения применения формул Маркуша.

2.5.1 Язык описания Маркуш - радикалов.

2.5.2 Интеграция в БД редактора MSE (Molecular Structure Editor).

2.5.3 Подсистема хранения формул Маркуша.

2.5.4 Подсистема поиска по формулам Маркуша.

2.6 Использование молекулярных фрагментов (структурных дескрипторов) химических веществ.

2.7 Программно-технологические решения для классификации информации.

2.7.1 Программно-технологические решения для классификации информации на основе справочников - реестров.

2.7.2 Программно-технологические решения для классификации информации на основе количественных данных.

2.7.3 Программно-технологические решения для классификации информации на основе молекулярной информации (дескрипторы, структуры, формулы Маркуша).

2.7.4 Программно-технологические решения для классификации информации на основе статистических моделей.

Глава 3. Методы, алгоритмы и программные средства для классификации и синтеза информации.

3.1 Методологические подходы моделирования, классификации и синтеза информации.

3.2 Информационная классификация.

3.3 Статистическая байесовская классификация.

3.4 Примеры использования байесовского подхода к классификации химических веществ.

3.5 Статистическая количественная классификация.

Глава 4.0сновные фрагменты структуры данных БД.

4.1 Концептуальная (логическая) схема БД.

4.2 Основные фрагменты физической структуры данных для регистрации/хранения химических веществ в БД.

4.3 Основные фрагменты физической структуры данных для классификации химических веществ в БД.

4.4 Основные фрагменты физической структуры данных для хранения фактографической информации в БД.

4.5 Основные фрагменты физической структуры данных для регистрации / хранения химических структур и молекулярных дескрипторов в БД.

Глава 5. Основные формы пользовательского интерфейса БД.

5.1 Экранная форма «Химикат».

5.2 Экранная форма «Поиск химикатов по структурной составляющей».

5.3 Экранная форма «Дескрипторы».

5.4 Экранная форма для классификации «Категорированные данные».

5.5 Экранная форма «Количественные данные».

5.6 Экранная форма «Обобщенный поиск».

5.7 Экранная форма «Обобщенный фильтр».

5.8 Экранная форма «Регрессионное моделирование».

5.9 Байесовский прогнозатор.

5.9.1 Экранная форма «Байесовский прогнозатор».

5.9.2 Экранная форма «Отбор дескрипторов».

5.9.3 Экранная форма «Построение моделей RTECS».

5.9.4 Экранная форма «Построение моделей TOXIC».

5.9.5 Экранная форма «Прогноз».

Направления дальнейших применений.

Рекомендованный список диссертаций по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка автоматизированных подсистем регистрации и классификации химико-структурных данных с использованием формул Маркуша в системе информационного обеспечения по проблемам химической безопасности»

Данная работа посвящена разработке программно-технологических средств для регистрации и классификации химико-структурных данных в химической базе данных (БД) в системе информационного обеспечения по проблемам химической безопасности, в том числе по аварийно химически опасным веществам (АХОВ), психотропным / наркотическим лекарственным веществам (ПЛВ/НЛВ), сильнодействующим ядовитым веществам (СДЯВ) и их прекурсорам, химическим веществам, подпадающим под действие Конвенции о запрещении химического оружия. Специальное внимание в работе уделено использованию формул Маркуша, позволяющих реализовать достаточно эффективный алгоритм формализации, классификации и интеграции данных и знаний по их химико-структурной составляющей, ориентированный на выявление опасных химических веществ.

1. Актуальность темы

В «Основах государственной политики в области обеспечения химической и биологической безопасности Российской Федерации на период до 2010 года и дальнейшую перспективу», утвержденных Президентом РФ В.В. Путиным (Пр-21944 от декабря 2003 г.), указывается на необходимость создания государственной системы обеспечения химической и биологической безопасности Российской Федерации (как подсистемы единой государственной системы предупреждения и ликвидации чрезвычайных ситуаций), предусматривающей категорирование, прогнозирование, предупреждение и парирование угроз химической и биологической безопасности, ликвидацию последствий чрезвычайных ситуаций в результате воздействия химических и биологических факторов [24].

Одним из важных направлений, указанных в документе, является разработка и внедрение информационных аналитических систем (НАС) в сфере математического моделирования для выявления закономерностей в области обеспечения химической и биологической безопасности [24].

Информационное обеспечение по проблемам химической безопасности непосредственно связано с формированием фактографических баз данных по токсическим химическим веществам (АХОВ, СДЯВ, ПЛВ, HJ1B и др.) и их прекурсорам, а также баз знаний - моделей для классификации, прогноза/восстановления пропущенных данных и выявления опасных химических веществ.

В настоящее время значительная часть фактографических данных, связанных с токсическими химикатами, рассредоточена по многочисленным информационным, медицинским, химическим, биологическим и технологическим базам данных, отдельным научным отчетам, технологическим регламентам, научным публикациям, патентам и нормативно-правовым/справочным документам. Зачастую, необходимая информация в этих ресурсах плохо формализована и не верифицирована, а иногда и просто отсутствует. Также, важно отметить, что использование таких ресурсов и зарубежных интегрированных информационных систем может быть ограничено конфиденциальностью как запрашиваемой информации (по совокупности), так и содержанием самого запроса, что не может не затрагивать интересы национальной безопасности [25].

Сложившаяся в настоящее время ситуация в части доступности мировых информационных ресурсов, технологии их переработки и прогресса в программных и технических средствах позволяет поставить и быстро решить задачу создания и поддержки жизненного цикла фактографических баз данных с химико-структурными данными для информационного обеспечения по проблемам химической безопасности.

Ключевыми компонентами при создании таких многоаспектных фактографических БД являются подсистемы регистрации и классификации химико-структурных данных. Их необходимость объясняется следующими причинами:

Процедура регистрации объектов в БД решает как непосредственно задачу обеспечения уникальности (идентификации) информации (химикатов), так и задачу целостности БД.

Процедура классификации данных является необходимой для эффективного использования данных при анализе и моделировании, в том числе для задач выявления вероятных прекурсоров синтеза опасных химических агентов.

В области химии наиболее представительной и актуальной системой регистрации химико-структурных данных индивидуальных химикатов является

CAS - Chemical Abstracts Service, БД которого включает более 25 миллионов веществ (по состоянию на май 2005 года). Сложившаяся за последние годы монополия CAS на оказание платной услуги на присвоение химикату уникального номера, не несущему никакой химической информации, во многих случаях затрудняет его использование в качестве кода/указателя для обращения к информации [80]. В плане программной реализации регистрации химических структур в БД можно также выделить подходы, предлагаемые фирмами MDL и DayLight.

Как правило, процедура классификации в БД реализуется на основе создания системы таблиц - классификаторов (справочников, словарей, документов, каталогов, рубрикаторов и т.п.) и приписыванием на их основе химикатам определенных классов. Также данная задача может решаться на основе обработки химико-структурной составляющей химикатов.

Классификаторы БД представляют знания об информационных объектах системы, что ведет к повышению качества пространства данных (верификация данных, классификация новых объектов, восстановление пропущенных данных). Т.е. по сути дела классификаторы БД представляет собой элемент базы знаний.

Принципиально важным подходом к решению вышестоящих задач является применение так называемых формул Маркуша (обобщенных химических структур).

Формула Маркуша (обобщенная химическая структура) представляет собой молекулярную структуру, состоящую из постоянной части и переменных заместителей [34]. По сути, представляя собой обобщение индивидуальных химических структур, формулы Маркуша могут выступать в качестве: гибких классификаторов химических веществ на основе химико-структурной информации, в том числе по списочным классам и структурным аналогам опасных химикатов; моделей обобщения и классификации при создании базы знаний по свойствам химических веществ.

Особенно широкое применение формулы Маркуша нашли в патентной области. В настоящее время только патентные базы наиболее крупных зарубежных информационных центров (Derwent World Patents Index; INPI Merged Markush Service (MMS) в сотрудничестве с Derwent Information Ltd (Markush

DARC); Chemical Abstracts Service MARPAT) обеспечивают регистрацию формул Маркуша и организацию доступа к ним широкого круга пользователей. Подобные же отечественные ресурсы отсутствуют, а публикации на эту тему носят единичный характер. Поэтому, включение в химические БД подсистем, способных обеспечить поддержку формул Маркуша, является весьма желательным.

Более широкое распространение в информационных технологиях Маркуш - формализации химических структур в настоящее время ограничено сложностью и трудоемкостью, как самой процедуры формализации, так и программно-методологическими средствами релевантного установления структурно - подструктурного соответствия в генерируемых информационных ресурсах.

В должной степени это относится и к проблемам формирования баз знаний в области химии и релевантным ей областям науки и техники. Поэтому, необходимо уделять много внимания актуальным вопросам разработки методологических подходов и программных средств химических баз данных для классификации и синтеза информации на основе формул Маркуша.

В диссертации формула Маркуша определяется как множество, класс химических соединений, отражающий определенный способ формализации, классификации, интеграции, унификации химико-структурной составляющей информации в области химии и химической технологии, в том числе и как способ представления условий запроса на поиск химических соединений в базах данных. При этом регистрация формул Маркуша по своей сути является должным образом организованной процедурой хранения в БД соответствующих поименованных запросов.

В данной работе рассматриваются следующие направления использования формул Маркуша в базах данных, предназначенных для решения задач в системе информационного обеспечения по проблемам химической безопасности:

1) разработка новой информационно - поисковой подсистемы обработки, хранения и манипулирования химико-структурной информацией в виде формул Маркуша;

2) разработка информационно - моделирующей подсистемы для прогнозной статистической классификации и оценки количественных свойств индивидуальных и обобщенных химических структур. Методика эффективного применения формул Маркуша иллюстрируется конкретными примерами из эксплуатируемых химических информационных систем.

Целью диссертации является разработка методов, алгоритмов и программных средств автоматизированных подсистем регистрации и классификации химико-структурных данных для решения задач в системе информационного обеспечения по проблемам химической безопасности.

2. Задачи диссертации

1) Исследование методов, алгоритмов, программных средств и структуры мировых информационных систем с химико-структурными данными по индивидуальным и обобщенным химическим структурам с акцентом на анализ подходов к решению задач поиска, классификации и синтеза информации;

2) Исследование существующих и разработка собственных форматов представления химических объектов (индивидуальных и обобщенных химических структур, а также других объектов, представимых помеченными графами);

3) Исследование и разработка методов, алгоритмов и программ для формализации, поиска/регистрации, классификации опасных химикатов и их прекурсоров в химических базах данных;

4) Разработка концептуальной схемы, проектных и программно-технологических решений по базе данных и базе знаний по опасным токсичным химикатам и их прекурсорам для ИАС по проблемам химической безопасности;

5) Интеграция разработанных программных средств, их тестирование/практическая апробация и исследование эффективности/полезности в ИАС для решения задач, связанных с осуществлением национального (федерального) контроля выполнения Конвенции о запрещении химического оружия [68,69].

3. Научная новизна

1) Разработаны структура данных и методы программной реализации регистрационной системы по химическим веществам, обеспечивающей регистрацию, хранение и поиск как индивидуальных, так и обобщенных химических структур;

2) Разработаны структура данных и методы для манипулирования химико-структурной и ассоциированной информацией по индивидуальным веществам и формулам Маркуша в базах данных в целях классификации и анализа/синтеза информации, в том числе для выявления потенциально опасных химикатов и их прекурсоров;

3) Разработаны структура данных, методы и программные средства для прогнозной статистической классификации химикатов на основе байесовского подхода и прогнозной оценки количественных свойств химикатов с использованием формул Маркуша;

4) Созданный программно-технологический инструментарий позволяет рассматривать задачи моделирования большой размерности 105 объектов, ~104 признаков/дескрипторов) и поставить разработку моделей в химических базах данных на регулярную основу с автоматизацией отбора релевантной для построения моделей информации из (в общем случае нескольких) реляционных таблиц базы данных.

4. Практическая значимость

1) Разработанные методы, алгоритмы и структурные решения воплощены и оттестированы в виде программно-технологических средств для обеспечения функций регистрации и классификации индивидуальных и обобщенных химических структур в химической БД, в том числе для осуществления национального контроля выполнения Конвенции о запрещении химического оружия;

2) Разработанные программно-технологические средства информационного и статистического моделирования показали эксплуатационную эффективность при обработке больших массивов фактографической информации в реляционных базах данных в целях построения прогнозных моделей классификации и количественных соотношений типа «свойство - свойства» (КССС) для оценки опасных токсических химикатов и их прекурсоров; 3) Разработанные программные средства внедрены в эксплуатируемую информационно-аналитическую систему по проблемам Конвенции о запрещении химического оружия Управления «Центр конвенционных проблем и программ разоружения» федерального агентства по промышленности (ИАС-ИМКС), интегральную химико-биологическую базу данных ЗАО ЦИНТЭНСИ, а также предложены для разработки новой регистрационной системы по химическим веществам ВИНИТИ РАН.

5. Структура диссертации

В данной работе рассматривается один из этапов формирования информационной аналитической системы в области обеспечения химической и биологической безопасности. В этот этап входит разработка системы автоматической регистрации и классификации химических веществ с использованием формул Маркуша.

Диссертация состоит из введения, пяти глав, заключения, списка литературы и приложения.

Похожие диссертационные работы по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Заключение диссертации по теме «Информационные системы и процессы, правовые аспекты информатики», Мартиросов, Александр Константинович

Заключение

1. В процессе работы над диссертацией были разработаны структура БД, алгоритмы, методы и программные интерфейсы для регистрации, хранения и анализа больших объемов химико-структурных данных и релевантной к ним фактографической информации.

2. Структура БД предполагает собой наличие механизма классификации химических веществ как необходимого элемента формирования знаний в БД. Для реализации подобного механизма в данной работе предлагается использовать формулы Маркуша, позволяющие реализовать достаточно эффективный алгоритм формализации, классификации и интеграции данных и знаний по их химико-структурной составляющей.

3. Таким образом, разработанные методы и программные средства баз данных и пользовательского интерфейса обеспечивают регистрацию, хранение, манипулирование и использование формул Маркуша в базах данных с химической информацией и создают предпосылки для глобальной экстракции, унификации, верификации и инвентаризации знаний как по моделям КССС, так и в целом по предметным областям знаний, релевантным химии.

4. Разработанные методологические подходы и программные средства апробированы и использованы при создании и эксплуатации базы данных по химическим веществам ЗАО ЦИНТЭНСИ (являющейся развитием информационной системы «Токсикология» [31]) и информационно -моделирующей системы по проблемам Конвенции о запрещении химического оружия (методология которой описана в работах [32] и [33]), а также при разработке новой версии регистрационной системы по химическим веществам ВИНИТИ [15].

Список литературы диссертационного исследования кандидат технических наук Мартиросов, Александр Константинович, 2005 год

1. Мартиросов А.К., Гончаренко Д.И., Зацепин В.М., Иванченко В.А. Применение формул Маркуша в современных химических информационных системах: методические и программно-технологические средства. // НТИ. Сер.2. 2004. - №4. - с. 21-33.

2. Бирюков A.JI., Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Мартиросов

3. Бирюков A.JL, Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Макаров

4. Афонина Н.Н., Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Кочанова Н.Н., Мартиросов А.К., Остапчук Р.В., Федоровская М.А. Разработка технологии создания и подготовки кумулятивного формульного указателя к

5. РЖ Химия на основе базы структурных данных по химии 1996-2000гг. Отчет о НИР, ВИНИТИ, 2001. № госрег. 01200204742. Инв.№ 02200203012. - 34 с.

6. Бирюков A.JL, Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Мартиросов

7. A.К., Остапчук Р.В. Автоматизированная обработка первичных и вторичных источников информации в области химии и химической технологии. Материалы 6-й Международной конференции «НТИ-2002», 16-18 октября 2002 г. М.: ВИНИТИ РАН, 2002.- с.271.

8. Мартиросов А.К., Бирюков A.J1., Гончаренко Д.И., Зацепин В.М., Иванченко

9. Афонина Н.Н., Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Кочанова Н.Н., Круглова Н.А., Мартиросов А.К., Остапчук Р.В., Федоровская М.А. Совершенствование технологии формирования межотраслевого издания (РЖ

10. Химическая и биологическая безопасность"). Отчет о НИР, ВИНИТИ, 2002. № госрег. 01200312874. Инв.№ 02200305414. - 14 с.

11. Афонина Н.Н., Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Мартиросов

12. A.К., Остапчук Р.В., Сафронова О.С. Адаптивная система информационного обеспечения для поддержки биомедицинских и токсикологических исследований. Проблемы стандартизации в здравоохранении. — М.: «Ньюдиамед», 2003. с. 61.

13. Гончаренко Д.И., Зацепин В.М., Иванченко В.А., Кочанова Н.Н., Катаева

14. Основы государственной политики в области обеспечения химической и биологической безопасности Российской Федерации на период до 2010 года и дальнейшую перспективу. Пр-2194 от 4.12.2003.

15. Прохожев А.А. Общая теория национальной безопасности. // Издательство: РАГС. 2002. - 318 с.

16. Нигматуллин Р.С., Осипов А.Л., Карпова Н.А. Система поиска и анализа патентной информации о химических соединениях // НТИ. Сер.2. - 1989. -№1. - с. 14-17.

17. Зацепин В.М., Нигматуллин Р.С. Информационно вычислительные системы в научных исследованиях по разработке пестицидов. — М.: НИИТЭХИМ, 1988.-с. 86.

18. Кульбак С. Теория информации и статистика. Пер. с англ. М. -1967.

19. Бородина Ю.В., Филимонов Д.А., Поройков В.В. Предсказание активности пролекарств с помощью компьютерной системы PASS. // Химико-фармацевтический журнал. 1996.-т. 30. — № 12.— с.39-41.

20. Новиков С.М., Нургабылова А.Б., Филимонов Д.А., Поройков В.В. Прогнозирование гигиенических регламентов промышленных веществ, обладающих раздражающим действием. // Гигиена и санитария. 1995. - № 6. -с.16-19.

21. Зацепин В.М., Иванченко В.А. База данных по химическим веществам «Токсикология» для аналитико-информационных технологий. Химия в России. - 1999.-№1.-с.14-17.

22. Зацепин В.М., Иванченко В.А., Левчук М.Н. Об информационном обеспечении проблем химической и биологической безопасности. Сб. "Федеральные и региональные проблемы уничтожения химического оружия". Вып.З. - М.: ВИНИТИ, 2003.- с. 141-144.

23. Glossary of Terms Used in Combinatorial Chemistry. // Pure Appl. Chem.- 1999. -Vol. 71. № 12.-pp. 2349-2365.

24. Устинова E.A. Формулы изобретения на химические объекты. М.: ИНФРА-М, 1997.-76 с.

25. Челышева О.В. Патенты на химические соединения: объем прав и их нарушение. М. - Инфра-М. -1996. - 64с.

26. Kathleen A. Cloutier. A Comparison of Three Online Markush Databases. // J. Chem. Inf. Comput. Sci. 1991. - vol. 31, pp. 40-44.

27. Устинова E.A. Кризис патентной информации в области химии // НТИ. Сер. 1.- 1995.-№10. - с.17-20.

28. Downs Geoff М., Barnard John М. Chemical patents and structural information — the Sheffield research in context. // Journal of Documentation. 1998. vol. 54. - № 1.-January - pp. 106-120.

29. Gillet V.J., Downs G.M., Holliday J.D. and Lynch M.F. Computer storage and retrieval of generic chemical structures in patents. 13. Reduced graph generation. // J. Chem. Inf. Comput. Sci. 1991. - № 31. - pp. 260-270.

30. Gedeck P., Willett P. Visual and computational analysis of structure — activity relationships in high throughput screening data. // Curr. Opin. Chem. Biol. -2001.-vol. 5.-pp. 389-395.

31. Ash Sheila, Cline Malcolm A., Homer R. Webster, Hurst Tad, Smith Gregory B. SYBYL Line Notation (SLN): A Versatile Language for Chemical Structure Representation. // J. Chem. Inf. Comput. Sci. 1997 - vol. 37 - pp. 71-79.

32. MDL Information Systems (2001). CTfile Formats. Technical report. MDL Information Systems Inc., available from http://www.mdli.com/ downloads/literature/ctfile.pdf.

33. Боровков A.A. Математическая статистика. — M.: Наука, 1984. 472с.; Математическая статистика. Дополн. главы. - М.: Наука, 1984. - 144с.

34. Афифи А.А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ.-М.: Мир, 1982.-с. 141-221.

35. Валуева Л.Н., Зацепин В.М., Степачев О.А., Торочешникова О.Н. Вопросы разработки автоматизированной системы научных исследований в отрасли ХСЗР. М.: НИИТЭХИМ. - 1989. - 88 с.

36. Зацепин В.М., Нигматуллин Р.С. Вопросы разработки автоматизированной системы научных исследований. // Сер. Химические средства защиты растений. М.: НИИТЭХИМ. - 1989.

37. Бирюков А.Л., Зацепин В.М., Иванченко В.А., Гончаренко Д.И. Адаптивная система информационного обеспечения по мембранным технологиям. 1. Основные принципы // Крит, технол. Мембраны. 2000. № 5, с. 29-44.

38. Бирюков А.Л., Зацепин В.М., Иванченко В.А., Гончаренко Д.И. Адаптивная система информационного обеспечения по мембранным технологиям. 2. Формирование проблемно-ориентированного информационного ресурса // Крит, технол. Мембраны. 2000. № 6, с. 61-70.

39. Avidon V.V., Pomerantsev А.В. Structure activity relationship oriented languages for chemical structure representation. // J. Chem. Inf. Comput. Sci. -1982. - Vol. 22. - № 4. - pp. 207-214.

40. Зацепин B.M., Иванченко B.A. Химическая информатика: системология, состояние, проблемы // Тез. докл. 7-го Междунар. конгресса «Человек и лекарство». М. 2000, с. 498.

41. Зацепин В.М., Иванченко В.А. Конструктивная модель биоинформатики и стратегия интегральных информационно-моделирующих систем // Тез. докл. 8-го Междунар. конгресса «Человек и лекарство». М. 2001, с. 482.

42. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах. //Открытые системы, № 4,1997, с.41-44.

43. Morgan H.L. The generation of unique machine description for chemical structures a technique developed of chemical abstract service. // J. Chem. Doc. — 1965. — Vol. 5.-№2.- pp. 107-113.

44. Бобровски Стив. Oracle8: Архитектура. Основные принципы построения и структура баз данных Oracle, а также переход к этой базе данных будущего. // Издательство «Лори», 1998.

45. Спирли Эрик. Корпоративные хранилища данных. Планирование, разработка, реализация. Том 1.-М.:Издательский дом «Вильямс».-2001.-400 с.

46. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир. - 1976.

47. Johannes Н. Voigt, Bruno Bienfait, Shaomeng Wang, and Marc C. Nicklaus. Comparison of the NCI open database with seven large chemical structural databases. // J. Chem. Inf. Comput. Sci. 2001. vol. 41. - pp. 702-712.

48. Блинова В.Г., Добрынин Д.А. Языки представления химических структур в интеллектуальных системах для конструирования лекарств. // НТИ. Сер.2. -2000.-№6.-с. 14-21.

49. Блинова В.Г., Добрынин Д.А., Жолдакова З.И., Харчевникова Н.В. Прогноз показателей хронической токсичности замещенных бензолов с помощью ДСМ-метода автоматического порождения гипотез. // НТИ. Сер.2. 2003. -№4.-с. 1-4.

50. Yoshimasa Takahashi, Masayuki Sukekawa, and Shin-ichi Sasaki. Automatic identification of molecular similarity using reduced-graph representation of chemical structure. // J. Chem. Inf. Comput. Sci. 1992. vol. 32. - pp. 639-643.

51. Кирьянова Л.Ф., Шашина T.A. Всероссийская научно-практическая конференция «Проблемы риска здоровью населения России от воздействия факторов окружающей среды». // Гигиена и санитария.-2004.-№ 2 с.75-79.

52. Влэдуц Г.Э., Гейвандов Э.А. Автоматизированные информационные системы для химии. -М.: Наука, 1974. - с. 137-146.

53. Austin Robert. The Complete Markush Structure Search: Mission Impossible? — PIUG North East Workshop, October 16th 2001. Fachinformationszentrum Karlsruhe, October 2001. http://www.fiz-karlsruhe.de.

54. Конвенция о запрещении разработки, производства, накопления и применения химического оружия, и о его уничтожении, 1993, ООН.

55. Сверхтоксичные смертоносные химические вещества. Специальный комитет по химическому оружию, Конференция по разоружению, CD/792, 25 января 1988г.

56. Liao Q., Yao J.H., Li F., Yuan S.G., Doucet J.P., Panaye A. and Fan B.T. Cisoc-psct: a predictive system for carcinogenic toxicity. // SAR and QSAR in Environmental Research. Vol. 15 (3). - 2004. - pp. 217-235.

57. Курляндский Б.А. Стратегические подходы к обеспечению безопасности производства и использования химических веществ для здоровья человека. // Российский химический журнал. 2004. - Том. XLVIII. - №2. - с. 8-15.

58. Филов В.А., Ивин Б.А. Химические загрязнители окружающей среды, токсикология и вопросы информации. // Российский химический журнал. -2004. Том. XLVIII. - №2. - с. 4-7.

59. Кирлан А.В., Тюрина J1.A., Кирлан С.А., Кирлан В.В., Колбин A.M., Валитов Р.Б. Компьютерная система прогноза токсичности. // Башкирский химический журнал. 2001. - Том 8. - № 1. - с. 36-39.

60. Зулькарнаев Т.Р., Тюрина Л.А., Соломинова Т.С., Новиков С.М., Кошелева О.М., Кирлан С.А. Профилактическая токсикология и гигиеническое нормирование. // Гигиена и санитария. — 1999. № 3. - с. 54.

61. Enselein К., Gombar V.K., Blake B.W. Use of SAR in computer-assistes prediction of carcinogenicity and mutagenicity of chemicals by the TORKAT programm. // Mutation research. 1994. - 305. - pp. 47-61.

62. Ridings J.E. et al., Computer prediction of possible toxic action from chemical structure: an update on the DEREK system, Toxicology, 1996,106,267-279.

63. Masunov A. ACD/I-Lab 4.5: An Internet Service Review. // J.Chem. Inf. Comput. Sci. 2001. - Vol 41. - № 4. - pp. 1093-1095.

64. Poroikov V.V., Filimonov D.A., Borodina Yu.V., Lagunin A.A., and Kos A. Robustness of biological activity spectra predicting by computer program PASS for noncongeneric sets of chemical compounds. // J. Chem. Inf. Comput. Sci. 2000. -№40.-pp. 1349-1355.

65. Barnard John M. A comparison of different approaches to Markush structure handling. // J.Chem. Inf. Comput. Sci. 1991. - № 31. - pp. 64-68.

66. Weisgerber D.W. Chemical abstracts service chemical registry system: history, scope and impacts. // J. Am. Soc. Inf. Sci. 1997. - № 48. - pp. 349-360.

67. Buntrock Robert E. Chemical registries in fourth decade of service. // J. Chem. Inf. Comput. Sci. - 2001. - № 41. - pp. 259-263.

68. Е.Ф.Кодд Реляционная модель данных для больших совместно используемых банков данных. // Ж. "СУБД" №1. - 1995. - с. 145-160.

69. Вендров A.M. CASE технологии. Современные методы и средства проектирования информационных систем. // М.: Финансы и статистика. -1998.- 176 с.

70. Lynch M.F. and Holliday J.D. The Sheffield generic structures project a retrospective review. //J. Chem. Inf. Comput. Sci. - 1996. - № 36. - pp. 930-936.

71. Downs G.M. and Barnard J. M. Chemical patents and structural information the Sheffield research in context. // Journal of Documentation. - 1998. - № 54. - pp. 106-120.

72. Barnard J. M. Substructure searching methods: old and new. // J. Chem. Inf. Comput. Sci. 1993. - № 33. - pp. 532-538.

73. Gasteiger J., Ihlenfeldt W., Fick R. and Rose J.R. Similarity concepts for the planning of organic reactions and syntheses. // J. Chem. Inf. Comput. Sci. 1992. -№32.-pp. 700-712.

74. Weininger D. SMILES, a chemical language and information system. 1: Introduction to methodology and encoding rules. // J. Chem. Inf. Comput. Sci. — 1988.-№28.-pp. 31-36.

75. Чеппел Д. Технологии ActiveX и OLE. M.: Издательский отдел «Русская редакция» ТОО «Channel Trading Ltd.», 1997.-320 с.

76. Trepalin S.V. and Yarkov A.V. CheD: chemical database compilation tool, internet server and client for SQL servers. // J. Chem. Inf. Comput. Sci. 2001. - № 41. — pp. 100-107.

77. Rzepa H.S. The internet as a computational chemistry tool. // Journal of Molecular Structure (Theochem). 1997. - pp. 27-33.

78. Зоркий П.М. Структурная химия на рубеже веков. // Рос. хим. ж. (Ж. Рос. хим. об-ва им. Д.И. Менделеева). -2001. том XLV. - №2. - с. 3-10.

79. Hyde R.M. and Livingstone D.J. Perspectives in QSAR: computer chemistry and pattern recognition. // Journal of Computer Aided Molecular Design. - 1988. - № 2.-pp. 145-155.

80. Donner W.T. Economic aspects of chemical information. // J. Chem. Inf. Comput. Sci. 1996. - № 36. - pp. 937-941.

81. Быстрое JI.B., Ситников В.Б., Тимофеева H.B. Использование канонических брутто формул связей при регистрации химических соединений в банке данных. // НТИ. Сер.2. - 1992. - № 10. - с. 8-11.

82. Helma С. and Kramer S. A survey of the Predictive Toxicology Challenge 2000-2001.//Bioinformatics.-2003.-Vol. 19.-№10. pp. 1179-1182.

83. Toivonen H., Srinivasan A., King R.D., Kramer S. and Helma C. Statistical evaluation of the Predictive Toxicology Challenge 2000-2001. // Bioinformatics. -2003.-Vol. 19.-№ 10.- pp. 1183-1193.

84. Benigni R. and Giuliani A. Putting the Predictive Toxicology Challenge into perspective: reflections on the results. // Bioinformatics. 2003. - Vol. 19. - № 10. - pp. 1194-1200.

85. Blinova V. G. , Dobrynin D.A., Finn V.K.,Kuznetsov S.O. and Pankratova E. S. Toxicology analysis by means of the JSM-method. // Bioinformatics. 2003. -Vol. 19. -№ 10. - pp. 1201-1207.

86. Нигматулин P.C.,Осипов А.Л.,Пузаткин А.П., Коптюг В.А. Статистический метод предсказания биологической активности многоатомных молекул на основе дескрипторов графов структурных формул //Хим.-Фарм.ж. 1985, т. 19, N2,179-185.

87. Клейман Б.Ш. Принципы построения поисковых систем структурной информации.Автореферат дисс. канд. техн. наук.-М.:ВНИИСИ.-1987.-18 с.

88. Atkinson М., Bansilhon F., DeWitt D., Dittrich К., Maier D., Zdonik S. The Object-Oriented Database System Manifesto // 1st Int. Conf. Deductive and Object-Oriented Databases, Kyoto, Japan, Dec. 4-6,1989.

89. Дейт К.Д. Введение в системы баз данных.//К.'Диалектика.- 1998. — 784с.

90. Осипов А.Л. Компьютерное моделирование свойств органических молекул с использованием фактографических банков данных. // Автореферат дисс. канд. техн. наук. Новосибирск: НГУ. - 1996. - 21 с.

91. Кумсков М.И. Методология прогнозирования свойств химических соединений и ее программная реализация. // Автореферат диссертации на соискание ученой степени доктора физико-математических наук. — М: Издательство «Диалог МГУ». - 1997. - 33 с.

92. RTECS Register of Toxic Effects Of Chemical Substances. // National Institute for Safety and Health. - USA.

93. Литвинов H.H., Остапенко Ю.Н., Казачков В.И. Информационные технологии для практики клинической токсикологии: Итоги и перспективы. // Токсикологический вестник. 1995. - № 6. - с. 16-20.

94. Румянцев Г.И., Новиков С.М. Проблемы прогнозирования токсичности и риска воздействия химических веществ на здоровье населения. // Гигиена и сан. 1997.-№6.-с. 13-18.

95. Зацепин В.М., Осипов A.JL, Семенов Р.Д. Система компьютерного предсказания физико-химических и биологических свойств веществ. // Автометрия. 1995. - № 5. - с. 86-91.

96. Курляндский Б. А., Шитиков В.К., Тихонов В.Н. Прогнозирование значений ПДК и других нормативов методом регрессионного анализа с использованием информационно-поисковой системы. // Гигиена и сан. -1986. № 8. - с. 63-66.

97. Раевский О.А., Чистяков В.В., Агабекян Р.С., Сапегин А.М, Зефиров Н.С. Формирование моделей взаимосвязи между структурой фосфорорганических соединений и их способностью к ингибированию холинэстераз. 1990. - Том 16.-№ п.с. 1509-1522.

98. ИЗ. Мучник В.Б., Нигматуллин Р.С., Осипов A.JI. Интерактивная система ввода структурных формул в химические базы данных. // НТИ. Сер.2. - № 8. -с. 6-11.

99. Ash J.T., Chubb Р.А., Ward S.E., Welford S.M., Willet P. Communication, storage and retrieval of chemical information. Eds. // Ellis Horwood Limited. -1985.-297 p.

100. Гусакова C.M., Финн В.К. Сходство и правдоподобный вывод. // Изд. АН СССР. Сер. Техн. кибернетика. 1987. - № 5. - с.42-63.

101. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения. // Итоги науки и техники. Сер. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. Том. 28. - М.: ВИНИТИ. - 1988. -с.3-84.

102. Валуева JI.H., Зацепин В.М., Промоненков В.К. Применение математических методов для анализа связи молекулярная структура — пестицидная активность. Часть 1. // Сер. Химические средства защиты растений. М.: НИИТЭХИМ. - 1985. - 57 с.

103. Валуева JI.H., Зацепин В.М., Промоненкой В.К. Применение математических методов для анализа связи молекулярная структура — пестицидная активность. Часть 2. // Сер. Химические средства защиты растений. М.: НИИТЭХИМ. - 1985. - 53 с.

104. Валуева JI.H., Зацепин В.М., Промоненков В.К. Применение математических методов для анализа связи молекулярная структура -пестицидная активность. Часть 3. // Сер. Химические средства защитырастений. М.: НИИТЭХИМ. - 1985. - 50 с.

105. Фукунага К. Введение в статистическую теорию распознавания образов. — М.: Наука.-1979.

106. Вапник В.Н. Червоненкис А.Я. Теория распознавания образов. М.: Наука. -1974.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.