Программные системы информационного обеспечения научной деятельности: модели, структуры и алгоритмы тема диссертации и автореферата по ВАК РФ 05.13.17, доктор технических наук Барахнин, Владимир Борисович

  • Барахнин, Владимир Борисович
  • доктор технических наукдоктор технических наук
  • 2010, Новосибирск
  • Специальность ВАК РФ05.13.17
  • Количество страниц 315
Барахнин, Владимир Борисович. Программные системы информационного обеспечения научной деятельности: модели, структуры и алгоритмы: дис. доктор технических наук: 05.13.17 - Теоретические основы информатики. Новосибирск. 2010. 315 с.

Оглавление диссертации доктор технических наук Барахнин, Владимир Борисович

Введение.

Глава 1. Теоретические основы создания интеллектуальных информационных систем.

§1.1. Уточнение используемой терминологии на основе семиотического подхода.

§ 1.2. Особенности научно-информационного процесса с участием интернет-документов.

§ 1.3. Методология изучения интернет-сайтов

Выводы к главе 1.

Глава 2. Анализ информационных потребностей научного сообщества.

§ 2.1. Основные характеристики информационных потребностей в сфере науки.

§ 2.2. Исследование информационных потребностей коллективных пользователей — научных учреждений СО РАН.

§ 2.3. Информационная модель описания деятельности научного сообщества.

Выводы к главе 2.

Глава 3. Структура основных компонентов программной системы.

§ 3.1. Формулировка требований к программной системе.

§ 3.2. Модель информационной системы.

§ 3.3. Модель направленных связей между документами.

§ 3.4. Структура логических компонентов программной системы.'.

Выводы к главе 3.

Глава 4. Извлечение метаданных из слабоструктурированных документов.

§ 4.1. Автоматизация процесса извлечения метаданных из слабоструктурированных документов

§ 4.2. Автоматизация процесса получения метаданных документов с использованием удаленных библиографических описаний.

§ 4.3. Автоматическое извлечение из документов ключевых слов.

Выводы к главе 4.

Глава 5. Автоматизация процесса классификации и кластеризации слабоструктурированных документов

§ 5.1. Автоматизированная технология построения тезаурусов и онтологий.

§ 5.2. Теоретические основы поиска документов "по аналогии".

§ 5.3. Кластеризация научных документов на основании меры сходства.

Выводы к главе 5.

Глава 6. Структуры представления научной и научно-организационной информации.

§ 6.1. Задание структуры представления информации на основании многомерной классификации.

§ 6.2. Структура информационно-справочной системы по истории науки (на примере математики).

§ 6.3. Структуры представления информации о деятельности научного сообщества (на примере СО РАН).

§ 6.4. Структуры представления информации о научно-инновационной деятельности.

Выводы к главе 6.

Глава 7. Практическая реализация программной системы информационного обеспечения научной деятельности.

§ 7.1. Функциональная схема программной системы.

§ 7.2. Практическое использование результатов исследований

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Программные системы информационного обеспечения научной деятельности: модели, структуры и алгоритмы»

Актуальность исследования. Проблема доступа к информации является одной из основных проблем, возникающих в деятельности научного исследователя. Любой научный процесс порождает огромные объемы данных, и работать с ними становится все сложнее по мере того, как гигабайты данных превращаются в терабайты. Так, еще в начале 1960-х годов американский историк и социолог науки Д. де Солла Прайс на основании исследований развития науки в течение последних 200 лет выявил следующую эмпирическую закономерность [265]: любой достаточно большой сегмент науки в нормальных условиях растет экспоненциально, то есть любые параметры науки за определенный промежуток времени удваиваются. Эта закономерность получила название закона экспоненциального роста науки. Отсюда следует необходимость разработки и создания новых инструментальных средств и алгоритмов для анализа этих данных, что отражено, в частности, и в новом Уставе Российской академии наук [186], согласно которому одной из задач деятельности РАН является информационное обеспечение научных исследований, а также создание и развитие на территории России научно-информационных сетей, баз и банков данных.

Важность комплексного исследования проблем, связанных с информационным обеспечением научной деятельности, была осознана отечественным научным сообществом еще в начале 1950-х годов, когда по представлению Академии паук СССР был создан Институт научной информации, ныне Всероссийский институт научной и технической информации (ВИНИТИ). Книги сотрудников этого института "Основы научной информации" [125], "Основы информатики" [124], "Научные коммуникации и информатика" [123] заложили основы информатики как науки о структуре и свойствах научной информации, а также о закономерностях научно-информационной деятельности, а монография "Инфосфера: Информационные структуры, системы и процессы в науке и обществе" [3] отразила достижения и проблемы информатики по состоянию на середину 1990-х годов.

Однако происшедшее за последние 10-15 лет бурное развитие высоких технологий в области передачи и обработки информации, в частности, создание современных телекоммуникационных систем (прежде всего интернета), привело к появлению принципиально новых возможностей организации практически всех этапов научно-информационного процесса, что в свою очередь обусловило качественный рост информационных потребностей научного сообщества, ибо "потребности социальных субъектов (личностей, социальных групп). зависят от уровня развития данного общества, а также от специфических социальных условий их деятельности" [229].

Кроме того, за указанный период времени в России произошло изменение принципов функционирования и финансирования науки, что также не могло не сказаться на характере информационных потребностей ученых.

Следовательно, возникает необходимость комплексного анализа информационных потребностей научного сообщества с учетом влияния как новых возможностей, открывшихся благодаря революции в области информационных технологий, так и изменившихся условий функционирования пауки.

Разумеется, ни в коей мере нельзя полагать, что классические способы удовлетворения информационных потребностей посредством получения информации на бумажных носителях, общения на конференциях и т.п. ушли в прошлое, однако наиболее перспективным направлением развития информационного обеспечения научной деятельности являются все-таки информационные технологии. В данном исследовании мы будем вести речь только о тех способах удовлетворения информационных потребностей научного сообщества, которые базируются на электронных технологиях. В рамках указанного подхода основным инструментом информационного обеспечения научной деятельности являются информационные системы, т.е. системы обработки данных о какой-либо предметной области [173].

В настоящее время научные сообщества наиболее развитых стран и регионов мира обладают достаточно мощными информационными системами. Так, в Европе функционирует интегрированная система ERGO [248], являющаяся частью проекта CORDIS [243] (об используемых в проекте стандартах см., например, [240]). Среди американских разработок своими масштабами выделяется информационная система Библиотеки конгресса США [259]. К числу наиболее крупных и востребованных научным сообществом отечественных информационных систем относятся Единое научное информационное пространство (ЕНИП) РАН [79], Информационная система "База данных организаций и сотрудников СО РАН" [7], "Информика" [731, Университетская информационная система РОССИЯ [185], Научная электронная библиотека eLIBRARY [128], Соционет [175]. Эти системы в той или иной степени удовлетворяют потребности исследователей в информации, однако каждая из них страдает определенными недостатками.

Во-первых, существенной проблемой большинства программных систем информационного обеспечения научной деятельности, предназначенных для функционирования в течение неопределенно долгого времени, является недостаточно своевременная актуализация информации (исключение составляют лишь библиотечные системы). Причина возникновения этой проблемы очевидна: недостаток средств, прежде всего, для оплаты труда лиц, которые должны отслеживать изменения информации, а также предъявляемые к этим лицам высокие квалификационные требования, возрастающие с усложнением структуры и возможностей поддерживаемой информационной системы. В частности, опыт выполнения интеграционных проектов СО РАН, в рамках которых производилось создание программных систем той или иной научной тематики, показал, что такие системы могут развиваться лишь в случае актуализации содержащейся в них информации самими пользователями этих систем. Наиболее эффективная реализация подобных проектов возможна в том случае, когда "черновая" информационная работа, неизбежная при каталогизации электронных документов научной тематики, составлении тезаурусов предметной области и т.п., в значительной степени автоматизирована посредством использования соответствующих программных средств, притом основную долю функций контроля качества полученной информации способен выполнить даже лаборант и лишь в редких случая требуется корректировка результатов с участием эксперта — научного работника.

К сожалению, задача автоматизации вовлечения электронных документов в научно-информационный процесс всё еще далека от сколько-нибудь удовлетворительного решения. Одна из основных причин сложившейся ситуации заключается в том, что с появлением в конце 1970-х годов персональных компьютеров появились мощные средства визуализации информации, вследствие чего были почти остановлены научные изыскания в области теории создания информационно-поисковых систем, которые возобновились лишь в середине 1990-х в связи с развитием информационных технологий интернета и перехода к распределенному хранению информации. В настоящее время в указанной области получены важные результаты (см. монографии [254, 276] и др.), однако эти разработки обычно опираются на неявное предположение о возможности широкого распространения более или менее подробной стандартизации представления информации, например на основе словарей (концепция Semantic Web консорциума W3 [274]). К тому же наработки консорциума W3 носят лишь рекомендательный характер, а объявить их стандартами могут только организации, имеющие соответствующий статус, такие как ISO, ГОСТ или ANSI, поэтому реальное развитие большинства ресурсов интернета, в том числе научной направленности, идет без учета подобных необязательных рекомендаций. Более того, свободный характер размещения материалов в интернете превращает требование соблюдения даже обязательных стандартов представления информации всего лишь в благое пожелание (особенно это касается российской части интернета: даже в рамках крупной научной корпорации не удается административно утвердить единые стандарты хранения и представления информации [11]).

Одним из наиболее неприятных следствий описанной ситуации является сложность поиска информации, содержащейся в текстовых документах интернета. Это относится даже к традиционным методам поиска, характерным, например, для библиотек: поиск по имени автора документа, названия документа или тематический поиск, поскольку слабоструктурированный электронный документ (то есть документ, снабженный метаданными1, но при этом имеющий неструкI турированные элементы) может не содержать явно заполненных соответствующих полей метаданных, причем классификационные признаки документа зачастую вообще отсутствуют. Разумеется, обработка слабоструктурированных документов не может быть полностью автоматизирована, и основная задача разработчиков соответствующих программных средств состоит в уменьшении необходимого участия человека в процессе контроля за качеством обработки информации.

1 Метаданные ("данные о данных") — структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими [277]. Подробнее о метаданных см. § 1.2.

Так как пользователи, принимающие участие в актуализации информации, могут находиться в разных регионах России и даже мира, то становится очевидным экономическая нецелесообразность использования коммерческих программных пакетов, предназначенных для частичной автоматизации процесса каталогизации электронных документов, создания и расширения тезаурусов (онтологии) и т. п., поскольку необходимость установки таких пакетов на компьютерах всех специалистов, поддерживающих данную информационную систему и при этом работающих в разных организациях (или использование сетевых версий, рассчитанных на большое число пользователей), связано с немалыми финансовыми затратами. Поэтому становится актуальной задача разработки и реализации алгоритмов, автоматизирующих основные этапы научно-информационного процесса (включая создание тезаурусов и онтологий), посредством интернет-приложений, доступных с любого компьютера сети (разумеется, после аутентификации и авторизации пользователя-эксперта).

Во-вторых, построение масштабных информационных систем для поддержки научной деятельности требует распределенного хранения информации. В частности, относительно систем научно-организационной направленности, создаваемых в рамках одной большой научной корпорации (например Сибирского отделения РАН), можно сделать вывод, что "эффективная эксплуатация информационных ресурсов возможна только в том случае, когда они постоянно поддерживаются авторами" [84]. Таким образом, информационная система научной корпорации должна строиться как объединение информационных систем отдельных организаций. В свою очередь, информационная система каждой организации состоит из нескольких разнородных подсистем (кадровая, библиографическая и т. п.).

Отсюда неизбежно возникает проблема интероперабелънослш, то есть обеспечения взаимодействия разнородных информационных источников (как с целью их непосредственной интеграции, так и для организации поиска по однотипным подсистемам различных информационных систем). Теоретические вопросы интероперабельности обсуждаются, например, в работах [52, 195]. Коротко резюмируя их содержание, можно отмстить, что организация в них поиска обеспечивается посредством согласования схем метаданных (семантическая ии-тероперабелъностъ). Для интеграции разнородных систем, а также разнородных ресурсов внутри каждой отдельно взятой системы (что необходимо для извлечения из содержащихся в информационной системе данных новой информации и знаний) требуется согласование как моделей данных и форматов их представления (синтаксическая инте-роперабельностъ), так и протоколов доступа к ресурсам (техническая интероперабельностъ).

Наконец, в-третьих, при создании информационных систем зачастую недостаточное внимание уделяется вопросам организации взаимодействия разрабатываемой системы с людьми -- потребителями информации. Так, А. Н. Колмогоров неоднократно отмечал, что данные представляют информационную ценность лишь тогда, когда они являются составной часть некоторой модели реального мира и связаны с другими данными [102, 103]. Тем самым, применение информациониых технологий должно основываться на использовании различных моделей (феноменологических, информационных, математических и др.). Как подчеркивал А. А. Ляпунов (см., например, [115]): "нет модели — нет информации".

Для возможности эффективного восприятия человеком данных нужно, чтобы они были превращены в "информацию", которая может быть представлена в виде "знаний"1 — "адеква/гного отражения действительности в сознании человека в виде представлений, понятии, суждений, теорий" [176]. Формально же знания представляются как структурированная (связанная причинно-следственными и иными отношениями) информация [3].

Сказанное, в частности, означает, что предполагаемая возможность извлечения из содержащихся в информационной системе данных новой информации и знаний влечет за собой необходимость наличия связей между документами, содероюащими упоминание тех или иных сущностей, с документами, описывающими эти сущности. Например, необходима связь имен собственных (как элементов библиографического описания и т. п.) с информацией о конкретных носителях этих имен, ибо в противном случае имя несет лишь назывную, но не информационную функцию [123].

Продолжая обсуждение проблемы организации взаимодействия с людьми — потребителями информации, следует отметить, что информационные потребности научных работников на этапе научного поиска

1Более подробно о соотношении понятий "данные", "информация" и "знания" речь пойдет в § 1.1. и изучения имеющихся в данной области результатов характеризуются невысокой четкостью осознания и выражения (см., например, [3]). Возникает необходимость оснащения информационных систем функцией поиска "по аналогии", т. е. есть нахождения по данному документу (или множеству документов) класса документов, схожих с ним по содержанию.

Если же говорить об атрибутивном поиске, то на практике большинство рядовых пользователей испытывает затруднения в самостоятельном построении запросов более сложных, нежели простой контекстный поиск, даже если им предоставлен удобный интерфейс, не требующий непосредственного использования языка запросов. Трудности возникают на уровне понимания схем данных и использования логических операторов, без которых немыслимы более или менее сложные запросы. Поэтому необходимо, чтобы рядовой пользователь информационной системы имел возможность получить интересующую его информацию посредством элементарных действий (навигации), при этом квалифицированным пользователям должны быть предоставлены дополнительные сервисы, отвечающие современным технологическим требованиям.

Решение перечисленных проблем возможно на пути создания интеллектуальных информационных систем, [3], в качестве составных компонент которых входят, наряду с традиционной информационной системой, еще и рассуждающая информационная система (формализующая правила логического вывода), а также интеллектуальный интерфейс (диалог, графика и т. д.), благодаря которому компьютер в диалоговом режиме усиливает комбинаторное мышление и логические возможности человека. При этом крайне важно, чтобы создаваемые системы могли обрабатывать в автоматизированном режиме слабоструктурированные документы.

Развитие сети Интернет предоставило создателям интеллектуальных информационных систем новые возможности, связанные с одновременным доступом ко множеству разнородных источников данных, что открывает широкие перспективы в развитии более совершенных технологий получения знаний. Однако многие современные исследования в области интеллектуального поиска опираются на неявное предположение о возможности широкого распространения более или менее подробной стандартизации представления информации. Разумеется, реализация подобных проектов, прежде всего концепции Semantic Web консорциума W3, позволила бы вывести работу с информацией на качественно новый уровень. Однако важная особенность сети Интернет как феномена цивилизации заключается в том, что развитие информационных ресурсов сети изначально носит децентрализованный характер, поэтому многие ресурсы, содержащие важную информацию из той или иной предметной области, не соответствуют рекомендациям консорциума W3. Отметим, что на большинстве сайтов документы являются слабоструктурированными, т.е. значения атрибутов их метаданных носят достаточно произвольный характер, а не являются элементами заданных словарей (это относится как к содержательным, так и к структурным метаданным).

Алгоритмы обработки слабоструктурированных документов описаны в работах как зарубежных ([245, 269] и др.), так и отечественных ([129, 130] и др.) авторов. Основная идея таких алгоритмов базируется, как правило, на анализе их Ыт1-разметки. Однако имеются важные нерешенные проблемы:

1. Из документов извлекаются лишь те данные, которые присутствуют непосредственно в них самих, хотя в удаленных библиографических базах данных зачастую содержатся более подробные описания документов, которые сделаны экспертами, включающие коды классификатора (обычно отсутствующие в самих документах), ключевые слова и др.

2. Координатное индексирование русскоязычных документов, как правило, ограничивается однословными терминами (что объясняется отсутствием соответствующих алгоритмов ввиду сложности морфологического анализа русских словосочетаний).

Таким образом, весьма актуальна решаемая в диссертационной работе проблема теоретического обоснования и разработки технологических основ создания программных систем, обеспечивающих автоматизированное включение в научно-информационный процесс слабоструктурированных документов с целью получения на основании содержащихся в них данных новой информации и знаний (в последнее время в качестве обозначения подобных систем пытаются закрепить термин "портал" [59]). Следует отметить, что для некоторых других классов информационных систем (прежде всего, тех. в которых семантика информации сравнительно проста) аналогичные задачи уже получили достаточно полное решение. В частности, вопросы анализа информационных систем, работающих с результатами измерений (так называемых информационно-измерительных систем, [201]), рассмотрены в монографии В. П. Бакалова [6].

Поставленная задача охватывает несколько комплексов проблем, требующих решения.

Во-первых, следует решить вопросы построения моделей основных компонентов интеллектуальной системы: как информационно-поисковой системы (рассматриваемой в абстрактном виде (см. [124, с. 253]), т. е. без учета средств технической реализации), так и логических компонентов, отвечающих за поиск информации, вывод новых знаний и диалог с пользователем.

Имеющиеся наработки в области теории моделирования баз данных, как классические, которые изложены, например, в монографии Д. Цикритзиса и Ф. Лоховски [202] (некоторые аспекты дальнейшего развития положений этой монографии, а также важные терминологические уточнения содержатся в статье М. Р. Когаловского [100]), так и современные, представленные, в частности, в диссертационной работе С. В. Зыкина [91], не могут в полной мере отвечать требованиям поставленной задали. Дело в том, что эти работы рассматривают в качестве логической единицы хранения, то есть основного элемента системы, запись в базе данных, в то время как развитие интернет-технологий требует рассматривать в этом качестве докул^ент, то есть в данном контексте информационный ресурс, имеющий (по определению [235]) уникальный идентификатор и обладающий некоторой структурой и содержанием.

Однако и рассмотрение ресурса в качестве основного элемента системы не решает всех проблем. Например, в модели RDF консорциума W3 [266] элементы суть ресурсы, которые могут представлять и сущности, и их характеристики. Неудобства такого подхода очевидны: приходится иметь дело с большим количеством равноправных мелких элементов, между которыми нужно устанавливать чрезвычайно много связей, вследствие чего структура модели далека от естественной. В модели ИСИР РАН [93] элементы суть "ресурсы, аналогичные до-кументоподобным объектам", а связи задаются с помощью отношений между типами ресурсов, то есть связи также имеют внешний характер по отношению к ресурсу.

Подход к построению моделей логических компонентов также принципиально отличается от подхода, применяемого специалистами в области искусственного интеллекта для разработки экспертных систем (см., например, монографию [66]): последние предназначены для решения узкоспециализированных задач, содержат относительно небольшой объем документов, и основной упор при их создании делается на развитие сложных продукционных правил, в то время как интеллектуальные системы, работающие с документальной информацией, могут обладать достаточно простыми продукционными правилами, а получение новых знаний становится возможным благодаря большому объему документов, способных выступать в качестве аргументов проверяемых утверждений.

Следовательно, необходима разработка оригинальных моделей основных компонентов интеллектуальной информационно-поисковой системы, учитывающих перечисленные выше особенности.

Во-вторых, поскольку документы информационной системы связаны между собой, неизбежно встает проблема возможного рассогласования информации. Так, включение в документы информации о разнородных сущностях может привести к появлению множественной информации об одном и том же объекте. Кроме того, для представления сложных документов, когда один документ является частью другого (полностью или частично, в том числе и в виде гиперссылки), необходимо выработать подходы к установлению связей между документами.

Таким образом, становится актуальной разработка технологии идентификации, спецификации и визуализации горизонтальных отношений между сущностями, информация о которых содержится во множестве документов, а также между документами, которые являются составной частью сложных документов. Одним из основных элементов этой технологии является разработка информационной модели отношений и тематических связей между документами системы.

Отметим, что в библиотечных системах, построенных на основе протокола Z39.50 и его версий [83], выполняется полное дублирование служебной информации. Аналогичная ситуация возникает в информационных системах, построенных на основе ЬБАР-каталогов [62], в которых имеется мощная система перекрестных ссылок, но используемая иерархическая модель не допускает отношений "многие-ко-мно-гим". Если такие отношения все же возникают, то появляется необходимость дублирования информации, что может привести к рассогласованию информации.

Ввиду этого целесообразно хранить информацию в единственном экземпляре, устанавливая в нужных случаях отношения "многие-ко-многим". Традиционный подход, применяемый при проектировании реляционных баз данных (см., например, [4, 121, 184]), заключается в рассмотрении многоместных отношений с их последующей декомпозицией в процессе нормализации. Его недостаток состоит в излишней привязке к структуре данных, поэтому актуальна задача разработки модели связей, обладающей более высоким уровнем абстрагируемости от структуры данных.

В-третьих, поскольку основной особенностью научно-информационного процесса с участием интернет-документов является необходимость и возможность частичной автоматизации процессов извлечения их метаданных и классификации, возникает задача создания соответствующих программных средств. При этом важно подчеркнуть, что в качестве эксперта, координирующего функционирование таких средств, может выступать любой пользователь системы, обладающий необходимым уровнем квалификации.

Разумеется, существуют программные инструменты, решающие те или иные частные вопросы автоматизации указанных процессов. Так, для извлечения из текстов информации на основании гипертекстовой разметки обрабатываемых документов созданы пакеты 11оас1Шшпег, Ыхк) и др. (см., например [245, 269]). Однако коммерческий характер таких программ и необходимость их специальной установки на компьютере каждого пользователя-эксперта (а количество таких пользователей может исчислять десятками и даже сотнями, притом они могут находиться в разных регионах России и даже мира) делает актуальной задачу реализации алгоритмов, автоматизирующих основные этапы научно-информационного процесса, посредством интернет-приложений, доступных с любого компьютера сети.

К этому же кругу задач относится разработка автоматизированной технологии создания тезауруса и онтологии той или иной предметной области, которая обеспечивала бы высококвалифицированное описание предметной области с использованием надежно выверенных терминов, позволяла бы минимизировать трудозатраты специалистов-экспертов.

В-четвертых, важной проблемой остается разработка структур представления научной и научно-организационной информации. Поскольку на практике большинство рядовых пользователей испытывают затруднения в самостоятельном построении запросов более сложных, нежели простой контекстный или атрибутивный поиск, постольку необходимо. чтобы базовая структура представления информации отвечала такой совокупности заранее сформулированных информационных запросов, которая была бы в состоянии удовлетворить основные информационные потребности пользователей системы.

К тому же следует учитывать, что широта и многогранность информационных потребностей научного сообщества (см., например, [38]) вызывает необходимость массового создания информационных систем, разнообразных как по тематике, так и по целевому назначению, что приводит к необходимости систематического изучения всех стадий процесса разработки интеллектуальных систем, включающего стадии создания концептуальной модели информационной модели и практической реализации системы.

Резюмируя сказанное выше, можно сделать вывод о том, что комплексное решение указанных проблем возможно лишь при осмыслении процесса компьютерной обработки слабоструктурированной информации как технологии. Заметим, что аналогичное осмысление другой области кибернетики — вычислительного моделирования — было осуществлено в начале 1980-х годов в работах академиков Н. Н. Яненко [230] и А. А. Самарского [1 ТО} и стало важной вехой в развитии прикладной математики.

В соответствии с [180] будем понимать под технологией совокупность методов обработки, изготовления, изменения состояния, свойств и формы сырья, материалов или полуфабрикатов в процессе производства продукции. Разумеется, одним из важнейших свойств технологии является ее воспроизводимость (это вытекает, например, из определения технологии как научной дисциплины, согласно которому технология изучает различные закономерности, действующие в технологических процессах [180]). Иными словами, любая технология по своей сути — воспроизводимый инструмент, применяемый для превращения потребляемых факторов в продукцию, или для достижения планируемых результатов [82].

Сошлемся еще на одно, пожалуй, наиболее краткое из определений технологии: "технология — способ преобразования данного в необходимое" (см., например, [181]), которое подтверждает, что применительно к поставленной задаче по-настоящему технологичным можно назвать лишь тот подход, который способен "перерабатывать" максимально широкие пласты интернет-ресурсов научной тематики.

Целью диссертационного исследования является теоретическое обоснование, разработка и реализация принципов создания программных систем информационного обеспечения научной деятельности, способных в автоматизированном режиме извлекать данные (описательные характеристики) из слабоструктурированных электронных документов с целью получения на основании этих данных новой информации и знаний.

Задачи, решаемые в работе:

1. Анализ информационных потребностей научного сообщества в свете изменений, вызванных распространением интернет-технологий, а также новыми принципами функционирования и финансирования российской науки, основанный на сравнении характеристик информационных потребностей, изучении интеграционных проектов СО РАН и исследовании интернет-сайтов.

2. Разработка методологии комплексного изучения интернет-сайтов, учитывающей их информационное наполнение, организацию хранения и обработки данных, а также роль в информационном обеспечении соответствующего вида деятельности.

3. Создание модели информационного обеспечения деятельности научного сообщества, включая научно-организационную и научно-инновационную деятельность.

4. Разработка отвечающей основным системным принципам модели информационной системы.

5. Разработка информационной модели отношений и тематических связей между документами системы.

6. Разработка структуры логических компонентов системы, отвечающих за поиск информации, вывод новых знаний и диалог с пользователем.

7. Описание многомерных классификационных признаков, отвечающих такой совокупности заранее сформулированных информационных запросов, которая была бы в состоянии удовлетворить основные информационные потребности пользователей системы, а также выделение соответствующих классификационных признаков для систем информационного обеспечения научной, научно-организационной и научно-инновационной деятельности.

8. Разработка методики создания тезаурусов и онтологий, обеспечивающей высококвалифицированное описание предметной области с использованием надежно выверенных терминов и позволяющей провести начальный этап работы с минимальным привлечением специалистов — экспертов в данной предметной области.

9. Исследование принципов и разработка алгоритмов автоматизации научно-информационного процесса с участием слабоструктуриро-ваниых документов, который включает извлечение метаданных из документов, координатное индексирование терминами-словосочетаниями и классификацию (кластеризацию) документов.

10. Внедрение результатов исследований в учебный процесс.

Объект исследования. Данные, содержащиеся в слабоструктурированных текстовых электронных (в т.ч. размещенных в интернете) документах научной и научно-организационной тематики.

Предмет исследования. Модели, структуры и алгоритмы, описывающие программные системы информационного обеспечения научной деятельности, предназначенные для работы со слабоструктурированными документами с целью получения на основании содержащихся в них данных новой информации и знаний.

Методология и методы исследования.

Методологические основы информатики как науки о структуре и свойствах научной информации заложены в монографиях сотрудников ВИНИТИ А. И. Михайлова, А. И. Черного, Р. С. Гиляревского, Ю. М. Арского и др. [125, 124, 123, 3], а также Б. В. Бирюкова [55].

Методология системного анализа, у истоков которой стояли А. А. Богданов [57] и Л. фон Бсрталанфи [237, 238], была развита в работах М. Месаровича и Я. Такахары [122], В. Н. Садовского [159] и др. Применительно к кибернетическим системам методология системного анализа была описана в статье А. А. Ляпунова и С. В. Яблонского [116], а к информационным системам — в работах Ю. А. Шрейдера и др. [221, 226].

Методология автоматизации процессов обработки текстовой информации описана в работах Дж. Солтона (Г. Сэлтона) [270, 271], а также (с учетом особенностей русского языка) Г. Г. Белопогова и др. [54, 53].

Методология разработки программных систем информационного обеспечения различных аспектов научной деятельности на базе новых интернет-технологий предложена Ю. И. Шокиным и А. М. Федотовым [209-214, 187]; А. Б. Жижчеико, В. А. Серебряковым, А. Н. Бездушным и др. [93, 51, 52]; С. В. Мальцевой [118], Д. В. Гаскарова ¡68] и др.

Методы организации хранения и поиска информации непосредственно в базах данных подробно изложены, например, в монографии Э. Э. Гасаиова и В. Б. Кудрявцева [67].

В диссертации использованы также методы семиотики, теории моделирования баз данных, теории сходства, математического моделирования.

Научная новизна. Полученный в работе комплекс теоретических результатов, обобщений и исследований позволил решить научно-техническую проблему теоретического обоснования и разработки технологических основ создания программных систем, обеспечивающих автоматизированное включение в научно-информационный процесс слабоструктурированных документов с целью получения на основании содержащихся в них данных новой информации и знаний.

Наиболее существенные научные результаты заключаются в следующем: Обоснована методология комплексного изучения интернет-сайтов.

Предложена модель информационного обеспечения деятельности научного сообщества, отличительными особенностями которой являются четкое выделение субъектов (включая организации и группы) и объектов деятельности, а также неиерархичность структуры субъектов деятельности.

Разработана отвечающая основным системным принципам модель информационной системы, отличительной особенностью которой является использование в качестве основных структурных элементов документов (целостных информационных объектов, снабженных метаданными), связи между которыми задаются посредством направленных связей.

Разработана структура логических компонентов интеллектуальной системы, базовыми объектами которой являются каталог, объединяющий поисковые образы исходных документов, и онтология предметной области.

Предложена базовая структура представления информации на основании многомерной классификации, описываемая посредством задания подмножества метаданных, определяющего набор классификационных признаков, и сочетаний значений этих метаданных.

Разработана методика создания тезаурусов и онтологий па основе предметного указателя специализированных энциклопедий, отличительной особенностью которой является возможность автоматизированного установления связей между терминами.

Исследованы принципы и предложены алгоритмы автоматизации основных этапов научно-информационного процесса с участием слабоструктурированных документов (включая извлечение метаданных, определение ключевых слов, классификацию и кластеризации), причем программные средства, реализующие эти алгоритмы, функционируют как сетевые приложения.

Достоверность и обоснованность научных положений, результатов, выводов и рекомендаций, приведенных в диссертационной работе, обеспечиваются применением надежных методов исследования, корректностью использования адекватного математического аппарата и подтверждены результатами использования предложенных информационных моделей и структур при создании целого ряда разделов Информационно-справочной системы Сибирского отделения РАН, применением разработанных алгоритмов обработки слабоструктурированной информации для развития разрабатываемых в институтах СО РАН информационных систем по конкретным направлениям наук, а также апробацией и обсуждением результатов работы на международных и всероссийских научных конференциях, рецензированием и предварительной экспертизой научных статей, опубликованных в ведущих научных изданиях.

Практическая значимость. На основе полученных в работе теоретических результатов и методических рекомендаций создан комплекс методов, обеспечивающий решение важной научно-технической задачи: включения в научно-информационный процесс слабоструктурированных интернет-документов с целью получения на основании содержащихся в них данных повой информации и знаний.

Результаты работы использованы при выполнении проекта конкурса молодых ученых ННЦ СО РАН "Интегрированная информационная система научного сообщества (пилотный проект — система «Математика»)" (автор выступал в роли руководителя проекта); молодежного научного проекта СО РАН № 2003-6 "Разработка информационной системы «\¥еЬ-ресурсы математического содержания»" (автор выступал в роли руководителя проекта); проектов программы поддержки ведущих научных школ РФ № НШ-2314.2003.1 "Информационно-вычислительные технологии в задачах принятия решений". НШ-9886.2006.9 и № НШ-931.2008.9 "Разработка информационно-вычислительных технологий в задачах принятия решений", НЩ-6068.2010.9 "Разработка информационно-вычислительных технологий поддержки принятия решений"; Федеральной целевой программы "Научные и научно-педагогические кадры инновационной России" на 2009-2013 гг. (госкоптракт ГК № П484 от 04.08.2009 г. по проблеме "Создание научно-технического задела, направленного на разработку новых, эффективных с позиций функциональности и безопасности, основанных на он-тологиях, мультиагентных технологий управления распределенными разнородными информационными хранилищами и библиотеками информационных ресурсов"); госконтрактов "Технология разработки распределенных программных систем для мониторинга больших корпоративных научно-образовательных сетей передачи данных на базе современных методов интеллектуального анализа данных и машинного обучения" (шифр 2007-4-1.4-00-04-103) и "Технология разработки распределенных программных систем для мониторинга и обеспечения информационной безопасности информационных систем, потенциально уязвимых в отношении деструктивных информационных воздействий" (шифр 2007-4-1.4-15-04-004); проектов РФФИ № 03-07-90423-в "Виртуальный музей науки и техники СО РАН", № 06-07-89060-а "Разработка модели виртуальной среды для обмена результатами научных исследований", № 06-07-99003-с "Ресурсы сети Интернет как объект научного исследования" (конкурс научно-популярных статей, в соавторстве с А. М. Федотовым), № 07-07-00271-а "Разработка и анализ модели управления доступом к распределенным информационным ресурсам" № 09-07-00277-а "Разработка технологий построения распределенных интегрируемых систем обработки, хранения и передачи информационных ресурсов на основе открытых спецификаций моделей данных", № 10-07-00302—а "Разработка и анализ модели построения электронных библиотек на основе международных стандартов"; интеграционных проектов СО РАН № 2003-132 "Виртуальный музей науки и техники СО РАН", № 2006-34 "Создание распределенной информационно-аналитической среды для исследований экологических систем", № 2006-35 "Древовидный каталог математических интернет-ресурсов", № 2006-115 "Разработка интеллектуальных информационных технологий генерации и анализа знаний для поддержки фундаментальных научных исследований в области естественных наук", № 2009-50 "Модели изменения биосферы на основе баланса углерода (по натурным и спутниковым данным и с учетом вклада бо-реальных экосистем)".

Результаты исследований были отмечены премией конкурса Администрации Новосибирской области за научные разработки молодых ученых и премией Благотворительного фонда В. Потанина за победу в конкурсе "Лучшие молодые преподаватели вузов Сибирского федерального округа".

Результаты исследований внедрены в Информационно-справочной системе СО РАН, занимающей, по данным на июль 2010 г. рейтинга \¥еЬоте!;пс8, в который входят сайты ведущих научно-исследовательских центров всего мира, 1-е место среди российских сайтов (19-е — в Европе, 54-е — в мире) [278]), а также использованы в процессе создания ряда систем информационного обеспечения научной деятельности: Электронного атласа биоразнообразия животного и растительного мира Сибири, Электронной библиотеки МаШТгее, Распределенной информационно-аналитической среды для экологических исследований, сайта журнала "Вычислительные технологии".

Результаты диссертационной работы использованы в учебном процессе кафедры математического моделирования Новосибирского государственного университета, кафедры вычислительных технологий Новосибирского государственного технического университета и кафедры прикладной математики и кибернетики Сибирского государственного университета телекоммуникаций и информатики.

Основные положения, выносимые на защиту. Технологические основы создания программных систем, обеспечивающих автоматизированное включение в научно-информационный процесс слабоструктурированных документов с целью получения на основании содержащихся в них данных новой информации и знаний, включающие в себя: модель информационного обеспечения деятельности научного сообщества, отличающуюся от известных четким выделением субъектов и объектов деятельности; отвечающую основным системным принципам модель информационной системы, представляемой как множество документов (целостных информационных объектов, снабженных метаданными), связи между которыми задаются посредством направленных связей; оригинальный алгоритм создания тезаурусов и онтологий на основе предметных указателей специализированных энциклопедий;

- принципы и алгоритмы автоматизации основных этапов научно-информационного процесса с участием слабоструктурированных документов (включая извлечение метаданных, определение ключевых слов, классификацию и кластеризцию), причем программные средства, реализующие эти алгоритмы, функционируют как сетевые приложения.

Апробация результатов исследования. Основные положения диссертации обсуждались на многих международных, всероссийских и региональных конференциях, в том числе на Всероссийских научных конференциях "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - Ш1ЮЬ (Дубна, 2002; Санкт-Петербург, 2003; Ярославль, 2005; Суздаль, 2006; Переславль-Залесский, 2007; Дубна, 2008; Петрозаводск, 2009; Казань, 2010); Второй Международной конференции IASTED по автоматизации управлению и информационным технологиям (Новосибирск, 2005); Международных конференциях и совещаниях по электронным публикациям - El-Pub (Новосибирск, 2002, 2003, 2004); Всероссийских конференциях с участием иностранных ученых "Распределенные информационно-вычислительные ресурсы" - DICR (Новосибирск, 2005, 2008); Международной конференции "Распределенные информационно-вычислительные ресурсы" (Казахстан, Павлодар, 2006); Международной конференции "Вычислительные и информационные технологии в науке, технике и образовании" (Казахстан, Алма-Ата, 2004); Международных конференциях "Системный анализ и информационные технологии" - САЙТ (Переславль-Залесский, 2005; Звенигород, 2009); Международной конференции "Мальцевские чтения" (Новосибирск, 2008), Всероссийских конференциях с международным участием "Знания - Онтологии -Теории" - ЗОНТ (Новосибирск, 2007, 2009): Всероссийских научно-практических конференциях "Инновационные недра Кузбасса. ГГ-тех-нологии" (Кемерово, 2005, 2007, 2008); Всероссийской научно-практической конференции "Системы автоматизации в образовании, науке и производстве" (Новокузнецк, 2007); Всероссийских конференциях молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003; Монголия, Ханх, 2009 — лекционный доклад; Красноярск, 2010 — лекционный доклад); Конференциях молодых ученых СО РАН, посвященных М. А. Лаврентьеву (Новосибирск, 2003, 2004); а также на семинарах и совещаниях в Институте вычислительных технологий СО РАН, Институте системного анализа РАН, Институте математики СО РАН, Институте систем информатики СО РАН, Институте динамики систем и теории управления СО РАН, Московском государственном университете печати, Новосибирском государственном университете и др.

Публикации. Основные результаты диссертации опубликованы в статьях [10, 23, 25, 29, 32, 33, 35, 3G, 38, 44, 46, 47, 64, 157, 189, 190, 192, 194, 215, 216, 258] (соответствующие журналы входят в список ВАК). Кроме того, результаты исследований по теме диссертации публиковались в научном электронном журнале "Электронные библиотеки" [39], в трудах международных [9, 11, 12, 14, 15, 20, 21, 28, 37, 191, 205, 233, 275], всероссийских [8, 13, 16, 19, 22, 24, 26, 27, 30, 31, 34, 40, 41, 42, 43, 45, 48, 113, 158, 193, 206, 208, 217, 218] и региональных [17, 18] конференций.

В работах, выполненных в соавторстве, В. Б. Барахнину принадлежат результаты, относящиеся к исследованию информационных потребностей научного сообщества, разработке информационной модели описания деятельности научного сообщества, моделей и структур основных компонент интеллектуальной системы, модели направленных связей между документами, базовых структур представления информации, разработке методики комплексного изучения интернет-сайтов, разработке методики создания тезаурусов и онтологий на основе предметного указателя энциклопедий, исследованию принципов и созданию алгоритмов автоматизации научно-информационного процесса с участием слабоструктурированных интернет-документов, а также результаты по практическому использованию этих алгоритмов.

Структура и объем диссертации. Диссертация состоит из введения, 7 глав, заключения, списка использованных источников из 285 наименований, приложений (в т.ч. актов и справок о внедрении результатов в научных учреждениях и в учебный процесс вузов). Общий объем работы 315 е., включая 24 рисунка и 8 таблиц.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Барахнин, Владимир Борисович

10. Результаты исследования внедрены в Информационно-справочной системе СО РАН, что позволило повысить качество ее функционирования, а также использованы в процессе создания ряда систем информационного обеспечения научной деятельности: Электронного атласа биоразнообразия животного и растительного мира Сибири, Электронной библиотеки Ма^Тгее, тезауруса по гетерогенному катализу, сайта журнала "Вычислительные технологии", благодаря чему была достигнута существенная экономия трудозатрат, в т.ч. специалистов высшей квалификации.

11. Результаты использованы в учебном процессе кафедры математического моделирования НГУ. кафедры вычислительных технологий НГТУ и кафедры прикладной математики и кибернетики СибГУТИ.

Достоверность и обоснованность научных положений, результатов, выводов и рекомендаций, приведенных в диссертационной работе, обеспечиваются теоретической и методологической базой исследования (в т.ч. использованием методологии системного анализа рассматриваемых структур, обобщением результатов большого числа отечественных и зарубежных исследований, изучением процессов функционирования крупнейших систем информационного обеспечения иаучной деятельности), подтверждаются внедрением в Информационно-справочную систему СО РАН и в ряд тематических систем информационного обеспечения научной деятельности, использованием в учебном процессе новосибирских вузов, поддержкой отдельных направлений исследований грантами и премиями отечественных организаций, апробацией и обсуждением результатов работы на крупных международных и всероссийских конференциях, а также рецензированием и предварительной экспертизой научных статей, опубликованных в ведущих научных изданиях.

Сказанное позволяет сделать вывод о том, что полученные результаты могут рассматриваться в качестве теоретической и методологической основы для создания технологии процесса компьютерной обработки слабоструктурированной информации, содержащейся в документах научной тематики.

Заключение

В настоящем исследовании проведены теоретическое обоснование и разработка структур, моделей и алгоритмов, описывающих программные системы информационного обеспечения научной деятельности, предназначенные для включения в научно-информационный процесс слабоструктурированных интернет-документов с целью получения на основании содержащихся в них данных новой информации и знаний.

Были получены следующие основные результаты, полностью соответствующие поставленным целям и задачам:

1. Проведено исследование информационных потребностей научного сообщества в свете изменений, вызванных распространением интернет-технологий, а также новыми принципами функционирования и финансирования российской науки, основанное на сравнении характеристик информационных потребностей, изучении интеграционных проектов СО РАН в области информатики и исследовании интернет-сайтов.

2. Обоснована методология комплексного изучения интернет-сайтов, которая предусматривает их рассмотрение в трех аспектах: как источник данных, как техническое средство обработки и распространения информации и как социокультурный феномен.

3. Предложена модель информационного обеспечения деятельности научного сообщества, включающая научно-организационную и научно-инновационную деятельность.

4. Разработана отвечающая основным системным принципам модель информационной системы, элементами которой являются документы (целостные информационные объекты, снабженные метаданными).

5. Разработана модель направленных связей между документами, задающая на множестве документов бинарные отношения с дополнительными атрибутами, которая дает возможность описывать различные аспекты межсущностных отношений, позволяя представлять сложные документы, когда один документ является частью другого, и избегать дублирования информации.

6. Разработана структура логических компонентов интеллектуальной системы, базовыми объектами которой являются каталог, объединяющий поисковые образы исходных документов, и онтология предметной области.

7. Предложена базовая структура представления информации на основании многомерной классификации, отвечающая совокупности заранее сформулированных информационных запросов, удовлетворяющей основные информационные потребности пользователей системы.

8. Разработана методика создания тезаурусов и онтологии на основе предметного указателя специализированных энциклопедий.

9. Исследованы принципы и предложены алгоритмы автоматизации основных этапов научно-информационного процесса с участием слабоструктурированных документов (включая извлечение метаданных, определение ключевых слов, классификацию и кластеризации), причем программные средства, реализующие эти алгоритмы, функционируют как сетевые приложения.

Список литературы диссертационного исследования доктор технических наук Барахнин, Владимир Борисович, 2010 год

1. Андреев Ю.Ы. Научно-инновационные комплексы регионов как ресурс развития // Регионология. — 2002. — № 4. — С. 76-87.

2. Апресян Ю.Д. Избранные труды, том 1. Лексическая семантика. — М.: Школа "Языки русской культуры", Издательская фирма "Восточная литература" РАН, 1995.

3. Арский Ю.М., Гиляревский P.C., Туров И. С., Черный А. И. Инфосфера: Информационные структуры, системы и процессы в пауке и обществе. М.: ВИНИТИ, 1990.

4. Атпре Ш. Структурный подход к организации баз данных / Пер. с англ. — М.: Финансы и статистика, 1983.

5. Афанасьев К.Е., Шмакова JJ.E. Компьютерная обработка информации. — Кемерово: Кузбаесвузиздат, 2005.

6. Бакалов В.П. Теория функциональной сложности информационных систем. — Новосибирск: Наука, 2005.

7. База данных организаций и сотрудников СО РАН. — http://www.sbras.ru/sbras/db/.

8. Барахнин В.Б. Разработка тезауруса предметной области "Математика" // Вычислительные технологии, т. 8, Региональный вестник Востока, JV2 3 (19), совместный выпуск. — 2003. — Часть 1. С. 111-115.

9. Барахнин В.Б., Леонова Ю.В. Информационная модель отношений между документами в информационной системе // Вычислительные технологии. — 2005. — Т. 10. Специальный выпуск. - С. 129-137.

10. Барахнин В.Б., Леонова Ю.В., Федотов A.M. К вопросу о формулировке требований для построения информационных систем научно-организационной направленности // Вычислительные технологии. — 2006. — Т. 11. — Специальный выпуск. — С. 52-58.

11. Барахнин В.Б., Макаренко С.Н., Степанов Ю.Ю. Создание web-интерфейса LDAP-каталога сотрудников организации // Прикладная математика и математическое моделирование: Межвузовский сборник научных трудов. — М.: МГУП, 2007. — С. 13-16.

12. Барахнин В.Б., Нехаева В.А. Технология создания тезауруса предметной области па основе предметного указателя энциклопедии // Вычислительные технологии. 2007. — Т. 12. — Специальный выпуск 2. — С. 3-9.

13. Барахнин В.Б., Нехаева В.А., Федотов A.M. О задании меры сходства для кластеризации текстовых документов // Вестник НГУ. Сер.: Информационные технологии. 2008. — Т. 6. — Вып. 1. - С. 3-9.

14. Барахнин В.Б., Ткачев Д. А. Кластеризация текстовых документов на основе составных ключевых термов // Вестник НГУ. Сер.: Информационные технологии. — 2010. — Т. 8. — Вып. 2. — С. 5-14.

15. Барахнин, В.Б., Федотов A.M. Информационная система: взгляд на понятие // Вестник НГУ. Сер.: Информационные технологии. 2007. - Т. 5. - Вып. 2. — С. 12-19.

16. Барахнин В.Б., Федот,ов A.M. Исследование информационных потребностей научного сообщества для построения информационной модели описания его деятельности // Вестник НГУ. Сер.: Информационные технологии. — 2008. — Т. 6. — Вып. 3. — С. 48-59.

17. Барахнин В.Б., Федотов A.M. Методика построения информационно-справочной системы по истории математической науки / / Электронные библиотеки. — 2007. — Т. 10. — Вып. 1. — http: / / www.elbib.ru/index. phtml?page=elbib / rus/journal /2007/ partl/BF.

18. Барахнин В.Б., Федотов A.M. О понятии "информационная система" в свете современных информационных технологий // Труды VI Всероссийской научно-практической конференции "Инновационные недра Кузбасса. IT-технологии". — Кемерово, 2007. С. 139-144.

19. Барахнин В.В., Федотов A.M. Особенности информационно-поисковых систем общего назначения // Труды Всероссийской научной конференции "Научный сервис в сети Интернет: многоядерный компьютерный мир". — Новороссийск, 2007. — С. 340344.

20. Барахнин В.Б., Федотов A.M. Ресурсы сети Интернет как объект научного исследования // Известия вузов. Проблемы полиграфии и издательского дела. — 2008. — № 1. — С. 70-77.

21. Барахнин В.Б., Федотов A.M. Уточнение терминологии, используемой при описании интеллектуальных информационных систем, на основе семиотического подхода // Известия вузов. Проблемы полиграфии и издательского дела. — 2008. № 6 -С. 73-81.

22. Барсегян A.A., Куприянов М.В. Степаиенко М.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. — СПб.:1. БХВ-Петербург, 2004,

23. Бахвалов Н.С. Численные методы. — М.: Наука, 1970.

24. Бездушный A.A., Бездушный А.Н., Серебряков В.А., Филиппов В. И. Интеграция метаданных Единого научного информационного пространства РАН. — М.: ВЦ им. A.A. Дородницына РАН, 2006.

25. Бездушный А.Н., Кулагин М.В., Серебряков В.А., Бездушный A.A., Нестеренко А.К., Сысоев Т.М. Предложения по наборам метаданных для научных информационных ресурсов // Вычислительные технологии. — 2005. — Т. 10. — Специальный выпуск.- С. 29-48.

26. Белоногое Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. — М.: Наука, 1983.

27. Белоногое Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. — М.: Наука, 1979.

28. Бирюков Б.В. Кибернетика и методология науки. — М.: Наука, 1974.

29. Бобров Л.К. Организация стратегического управления информационной деятельностью библиотек и информационных центров в условиях рынка: Автореф. . доктора техн. наук: 05.25.05.1. Новосибирск, 2004.

30. Богданов A.A. Тектология: (Всеобщая организационная паука). В 2 кн. — М.: Экономика, 1989.

31. Борисова И.А., Загоруйко Н.Г. Функции конкурентного сходства в задаче таксономии // Материалы Всероссийской конференции с международным участием "Знания Онтологии - Теории" (30HT-07). - Новосибирск, 2007. - Т. 2. - С. 67-76.

32. Босов A.B., Иванов A.B. Программная инфраструктура информационного web-портала // Информатика и ее применения. — 2007. Т. 1. - Вып. 2. - С. 50-64.

33. J Бусленко Ii. П., Калашников В. В., Коваленко И. J f. Лекции по теории сложных систем. — М.: Советское радио, 1973.

34. Бэкон Ф. Новая Атлантида / Пер. с англ. //В кн.: Бэкон Ф. Сочинения в двух томах. — М.: Мысль (сер. Философское наследие), 1978. Т. 2. - С. 485-518.

35. Валиев М.К, Китаев Е.Л., Слепенков М.И. Использование службы директорий LDAP для представления ме-таипформации в глобальных вычислительных системах. — http://www.keldysh.ru/metacomputing/ism99.html.

36. Визитная карточка Сибирского отделения Российской академии наук. — http://www.sbras.ru/cmn/general.html.

37. Воронин Ю.А. Начала теории сходства. — Новосибирск: Наука. 1991.

38. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. —- СПб.: Питер, 2000.

39. Гасанов Э.Э., Кудрявцев В.Б. Теория хранения и поиска информации. — М.: Физматлит, 2002.

40. Гаскаров Д.В. Интеллектуальные информационные системы. — М.: Высшая школа, 2003.

41. Гвоздева Е. С., Высоцкий Е.М. Сегодняшний день будущего российской науки. — Новосибирск: Издательство СО РАН, 2004.

42. Гергей Т., Финн В.К. Об интеллектуальных системах //В кн.: Экспертные системы: состояние и преспективы. — М.: Наука, 1989. С. 9-29.

43. Гиндин С.И. Семантика текста и различные теории информации // Научно-техническая информация. Сер. 2. 1971. — № 10. — С. 10-15.

44. Голдман С. Теория информации / Пер.с англ. — М.: Иностранная литература, 1957.

45. Государственный НИИ информационных технологий и телекоммуникаций "Информика". — http://www.informika.ru.

46. Гуськов А.Е. Модель генерации и публикации информации при создании web-ориентированпых информационных систем // Ав-тореф. . кандидата техн. наук: 05.25.05. — Новосибирск, 2005.

47. Елисеев Ю.С., Малинецкий Г.Г., Медведев A.A., Харин A.A. Инновационный императив // Вестник национального комитета "Интеллектуальные ресурсы России". — 2004. — № 2. — С. 61-70.

48. Единое научное информационное пространство РАН. — http://www.ras.ru/.

49. Ермаков Н.Б., Столяров C.B., Федотов A.M. Модели данных для формирования биологических коллекций // Вестник H ГУ. Сер.: Информационные технологии. — 2007. — Т. 5. Вып. 2. — С. 35-41.

50. Ершов 10.Л., Клименко O.A., Матвеева И.Pl., Рабинович, Л.Р., Филиппов В.Э., Филиппова М.Я. Древовидный каталог математических интернет-ресурсов // Информационные ресурсы России. 2006. № 1. - С. 5-8.

51. Желеиы М. Управление высокими технологиями //В кн.: Информационные технологии в бизнесе. Энциклопедия / Пер. с англ. СПб.: Питер. 2002. - С. 81-89.

52. Жиоюимов О.Л., Мазов H.A. Принципы построения распределенных информационных систем на основе протокола Z39.50. — Новосибирск: Изд-во ИВТ СО РАН, 2004.

53. Жижимов О.Л., Турпанов A.A., Федотов A.M. Корпоративный каталог СО РАН // Труды Восьмой Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" (RCDL'2006). — Ярославль, 2006. С. 226-230.

54. Жмайло C.B. Исследование и разработка теории и методики построения тезаурусов для информационного поиска в полнотекстовых базах данных. Автореф. . кандидата техн. наук: 05.13.17. Москва, 2005.

55. Жукова Е.А., Мелик-Гайказян И.В. Философские проблемы технологий и феномен Hi-Tech //В кн.: Философия математики и технических паук. — М.: Академический Проект, 2006. — С. 557-586.

56. Зацман И.М. Концептуальный поиск и качество информации.- М.: Наука, 2003.

57. Зацман И.М. Семиотические основания и элементарные технологии информатики // Информационные технологии. — 2005.- № 7. С. 18-31.

58. Зверев B.C. Информационное обеспечение инновационной деятельности. — http://sinin.nsc.ru/infsys.html.

59. Зыкин C.B. Разработка и исследование моделей данных и средств организации взаимодействия пользователей с информационными ресурсами. Автореф. . доктора техн. наук: 05.13.17.- Омск, 2005.

60. Иконников A.B. Архитектура // Большая Советская Энциклопедия, изд. 3. М.: Советская Энциклопедия, 1970. — Т. 2. — С. 296-302.

61. Интегрирован,нал система информационных ресурсов (архитектура, реализация, приложения). (Отв. ред. В.А. Серебряков). — М.: ВЦ им. A.A. Дородницына РАН, 2004.

62. Информационная система СО РАН. — http://www.sbras.ru/.

63. Информационная система "Химия в СО РАН". — http: / / www.catalysis.nsk.su / chem/.

64. Информационная система "Web-ресурсы математического содержания". — http://www.sbras.ru/win/elbib/data,/ showpage.dhtml?2+184.

65. Информационные бюллетени Яндекса «Контент Рунета». — http: //company.yandex.ru/facts/researches/.

66. Каневский Е.А. Некоторые вопросы пополнения морфологического словаря терминами предметной области // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. — Аксаково, 2001. — Т. II. — С. 156-160.

67. Кант И. Пролегомены / Пер. с нем. — М.; JL: Соцэкгиз, 1934.

68. Когаловский М.Р. Абстракции и модели в системах баз данных // СУБД. 1998. - № 4-5. - С. 73-81.

69. Когаловский М.Р. Технология баз данных на персональных ЭВМ. — М.: Финансы и статистика, 1992.

70. Колмогоров А.Н. Теория информации и теория алгоритмов. — М.: Наука, 1987.

71. Колмогоров А.Н. Три подхода к определению понятия "количество информации" // Проблемы передачи информации. — 19G5. Т. I. - Вып. 1. - С. 3-П.

72. Компьютерре^. — 12 сентября 2005 года. — С. 6.

73. Концепция открытых систем // Материалы к межотраслевой Программе "Развитие и применение открытых систем". — http: / / www.lnformika.ru / text/inftech / opensys / 3/concept/os 1. html.

74. Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ / Пер. с англ. М.: МЦНМО, 2001.

75. Кузин Л.Т. Основы кибернетики. Т. I. — М.: Энергия, 1973.

76. Куценогий К. П., Куценогий Г1.К., МолороОов Ю.И. Федотов A.M. Разработка структуры метаданных по атмосферным аэрозолям на основе информационной модели // Вычислительные технологии. — 2004. — Т. 9. — Специальный выпуск. — Ч. 2. — С. 25-33.

77. Ляпунов A.A. О соотношении понятий материя, энергия и информация //В кн.: Ляпунов A.A. Проблемы теоретической и прикладной кибернетики. — Новосибирск: Наука, 1980. — С. 320 -323.

78. Ляпунов A.A., Яблонский C.B. Теоретические проблемы кибернетики // Проблемы кибернетики. — 1963. — Вып. 9. — С. 5-22.

79. Ляпунцова Е.В. Ииформационно-семиоитческие модели распределенных систем переработки информации. Автореф. . доктора техн. наук: 05.13.17. — Москва, 1996.

80. Мальцева C.B. Научно-методические основы автоматизации проектирования информационной архитектуры Web-рссурсов Интернет. Автореф. . доктора техн. наук: 05.13.12. — Москва, 2004.

81. Математическая энциклопедия в 5 томах. — М.: Советская энциклопедия, 1977-1985.

82. Математический портал. — http://math.ru/history/people/.

83. Мейер Д. Теория реляционных баз данных / Пер. с англ. — М.: Мир, 1987.

84. Месарович М., Такахара Я. Общая теория систем: математические основы / Пер. с англ. — М.: Мир, 1978.

85. Михайлов А.И., Черный А.И., Гиляревский P.C. Научные коммуникации и информатика. — М.: Наука, 1976.

86. Михайлов А.И., Черный А.И., Гиляревский P.C. Основы информатики. — М.: Наука, 1968.

87. Михайлов А.И., Черный A.M., Гиляревский P.C. Основы научной информации. — М.: Наука, 1965.

88. Наринъяни A.C. Кентавр но имени ТЕОН: Тезаурус + Онтология // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. — Аксаково, 2001. —-Т. I. С. 184-188.

89. Наринъяни A.C. ТЕОН-2: от Тезауруса к Онтологии и обратно // Труды международного семинара Диалог'2002 но компьютерной лингвистике и се приложениям. — Протвино, 2002. — Т. I. — С. 307-313.

90. Научная электронная библиотека eLIBRARY.RU. — http://elibrary.ru / defanltx.asp.

91. Некрасов И.В., Толчеев В.О. Построение модели представления библиографического документа // Информационные технологии. 2005. - № 11. - С. 57-63.

92. Никитина С.Е. Семантический анализ языка науки. — М.: Наука, 1987.

93. Овдей О.М. Проскудина Г.Ю. Обзор инструментов инженерии онтологий // Труды Шестой Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" (RCDL'2004). — Пущино, 2004. С. 59—68.

94. Огурцов А.П., Юдин Э.Г. Деятельность //В кн.: Философский энциклопедический словарь. — М.: Советская Энциклопедия, 1983. С. 151-152.

95. Осипов Г.С. Лекции по искусственному интеллекту. — М.:КРАСАНД, 2009.

96. Официальный сайт Государственной Думы. — http://www.duma.gov.ru.

97. Официальный сайт Русской Православной Церкви. — http://www.patriarchia.ru/.

98. Официальный сайт Союза писателей России. — http://sp. voskres.ru/prose/.

99. Панова И.О., Шрейдер Ю.А. Принцип двойственности в теории классификации // Научно-техническая информация. Сер. 2. — 1975. № 10. - С. 3-10.

100. Паркер-Роудс А. Ф., Уордли С. Применение тезаурусного метода при машинном переводе с помощью существующей машинной техники / Пер. с англ. //В кн.: Математическая лингвистика. Сборник переводов. — М.: Мир, 1964. С. 214-228.

101. Пахомов Б.Я. Проблема изменения значений научных понятий // Вопросы философии. 1973. - № 1. - С. 140 144.

102. Перечень зарегистрированных политических партий. — http: //www.cikrf.ru/politpa.rty/.

103. Петров В.М. Семантика научных терминов. Новосибирск: Наука, 1982.

104. Пойа Д. Как решать задачу / Пер. с англ. — М.: Учпедгиз, 1959.

105. Пойа Д. Математическое открытие / Пер. с англ. — М.: Наука, 1970.

106. Постановление Президиума СО РАН от 13.04.2000 № 137 "Об итогах конкурса интеграционных программ (проектов) СО РАН 2000 г." — http://www.sbras.ru/win/anonscs/373.litml.

107. Постановление Президиума СО РАН от 21.02.2003 № 62 "Об итогах конкурса интеграционных проектов СО РАН 2003 г.". — http://www.sbras.ru/win/anonses/841.htrril.

108. Постановление Президиума СО РАН от 26.01.2006 № 32 "Об интеграционных проектах, выполняемых по заказу Президиума СО РАН". — http://www.sbras.ru/win/anonses/1334.html.

109. Постановление Президиума СО РАН от 09.02.2006 № 54 "Об итогах конкурса комплексных интеграционных проектов СО РАН-2006". — http://www.sbras.ru/win/anonses/1341.html.

110. Постановление Президиума СО РАН от 09.02.2006 № 55 "Об итогах конкурса междисциплинарных интеграционных проектов СО РАН-2006". http://www.sbras.ru/win/anonses/1342.html.

111. Постановление Президиума СО РАН от 15.01.2009 № 9 "Об итогах конкурса междисциплинарных интеграционных проектов фундаментальных исследований СО РАН на 2009-2011 гг." — http: / /www. sbr as. г и/win/anonses /1921. html

112. Постановление Президиума СО РАН от 15.01.2009 № 10 "Об итогах конкурса проектов, выполняемых совместно со сторонними научными организациями, на 2009-2011 годы". — http: / / www.sbras.ru / win/anonses/1922.html

113. Раскина A.A., Солодовник М.П. Логико-лиигвистические аспекты проблемы обработки вопросов в фактографической ИПС // Вопросы информационной теории и практики. — 1979. — № 42.

114. Российская сеть трансфера технологий. -- http://www.rttn.ru/.

115. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. — М.: Наука, 1989.

116. Рубцов Д.Н., Барахнии В.Б. Выявление дубликатов в разнородных библиографических источниках // Вестник НГУ. Сер.: Информационные технологии. — 2009. — Т. 7. — Вып. 3. — С. 8693.

117. Садовский В.Н. Основания общей теории систем. — М.: Наука, 1974.

118. Садовский В.Н. Система // В кн.: Философский энциклопедический словарь. — М.: Советская Энциклопедия. 1983. — С. 610611.

119. Сайт Большого Театра. — http://www.bolshoi.ru.

120. Сайт Екатеринбургского государственного академического театра оперы и балета. — http://www.uralopera.ru/.

121. Сайт журнала "Вычислительные технологии". — http: //www.ict.nsc.ru/jct/.

122. Сайт Мариииского театра, — http://www.iriariinsky.ru/.

123. Сайт "Научные сотрудники математики СО РАН". — http: //www.sbras.ru/sbras/mathsoran/.

124. Сайт Новосибирского государственного академического театра оперы и балета. — http://www.opera-novosibirsk.ru/.

125. Сайт "Организации СО РАН".http://www.sbras.ru/sbras/db/dep.phtml73-f-rrus.

126. Сайт "Перечень важнейших разработок СО РАН, предлагаемых для широкого использования".http: / /www.sbras.ru/win/sbras/main-work.html.

127. Сайт "Члены Российской академии наук", http: / / www. ras. ru / members, aspx.

128. Самарский A.A. Задачи прикладной математики на современном этапе развития // Коммунист. — 1983. — № 18. — С.31-42.

129. Сеть передачи данных Сибирского отделения РАН. — http://www.ac-tel.ru/mw/index.php/Введеиие.

130. Словарь "Лингво" компании "Яндекс". hUp://lingvo.yandex.ru.

131. Словарь по кибернетике. 2-е изд., переработанное и дополненное. -- Киев: Главная редакция Украинской Советской Энциклопедии им. М.П. Бажана, 1989.

132. Словарь русского языка для Ispell. —http: / / semiconductors.phys.msu.su / ~swan / orthography.html.

133. Социоист. — http://socionet.ru/.

134. Спиркии А. Г. Знание //В кн.: Философский энциклопедический словарь. — М.: Советская Энциклопедия. 1983. — С. 192.

135. Список крупнейших компаний России журнала "Эксперт". — http://www.raexpert.ru / rankingtable/?tablefolderexpert400/2009/main/.

136. Стимер компании "Яндекс". —http: //company.yandex.ru / technology / mystem/.

137. Тезаурус по гетерогенному катализу. — http://www.ca,talysis.ru:80/thezaurus/application/.

138. Технология //В: Большой академический словарь. — СПб: Научное изд. Большая Российская энциклопедия, 2003. — С. 2000.

139. Технология // В: Тезаурус по образованию и педагогике. — Институт информатизации образования в составе Московского государственного гуманитарного университета имени М.А.Шолохова. — http://www.mgopu.ru/inmfo/r3 thesaurus.htm^technology.

140. Толчеев В.О. Модели и методы классификации текстовой информации // Информационные технологии. — 2004. — № 5. — С. 6-14.

141. Тузов В.А. Компьютерная семантика русского языка. СПб.: Изд-во СПбГУ, 2004.

142. Ульман Дж. Основы систем баз данных / Пер. с англ. — М.: Финансы и статистика, 1983.

143. Университетская информационная система РОССИЯ. — http://www.cir.ru/index.jsp.

144. Уст,ав Российской академии наук. Утвержден Постановлением Правительства РФ от 19 ноября 2007 г. JY2 785. — http: / / www.ras.ru/about / rascharter.aspx.

145. Федотов A.M. Методологии построения распределенных систем // Вычислительные технологии. — 2006. — Т. 11. — Специальный выпуск. — С. 3-16.

146. Федотов A.M., Артем,ов И.А., Ермаков Н.Б., Красников A.A., Потемкин О.И., Рябко Б.Я., Федотов A.A., Хорее А.Г. Электронный атлас "Биоразнообразие растительного мира Сибири" // Вычислительные технологии. — 1998. — Т. 3. — № 5. — С. 68-78.

147. Федотов A.M., Барахнин В.Б. К вопросу о поиске документов "по аналогии" // Вестник НГУ. Сер.: Информационные технологии. 2009. - Т. 7. - Вып. 4. - С. 3-14.

148. Федотов A.M., Барахнин В.Б. Проблемы поиска информации: история и технологии // Вестник НГУ. Сер.: Информационные технологии. 2009. - Т. 7. - Вып. 2. - С. 3-17.

149. Федотов A.M., Барахнин В.Б., Гуськов А.Е., Молородов Ю.И. Распределенная информационно-аналитическая среда для исследований экологических систем // Вычислительные технологии. — 2006. — Т. 11. — Специальный выпуск. — С. 113-125.

150. Фейгип Д. Концепция SOA / llep. с англ. // Открытые системы. 2004. - № 6. - http://www.oap.ru/os/2004/06/184447 /pl.html.

151. Физическая энциклопедия в 5 томах. — М.: Российская энциклопедия, 1998.

152. Фомичев В.А. Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров. Автореф. . доктора техн. наук: 05.13.11. — Москва, 2005.

153. Химическая энциклопедия в 5 томах. -- М.: Российская энциклопедия, 1998.

154. Холл АД., Фейдоюин P.E. Определение понятия системы / Пер. с англ. //В кн.: Исследования по общей теории систем. М.: Прогресс, 1969. - С. 252-282.

155. Хохлов Ю.Е., Арнаутов С.А. Обзор форматов метаданных // Российские электронные библиотеки. — http://www.elhib.ru/ index. phtml?page=elbib/rus/methodology/mdrev.

156. Цапенко М.П. Измерительные информационные системы. — М.: Энергоиздат, 1985.

157. Цикритзис Д., Лоховски Ф. Модели данных / Пер. с англ. — М.: Финансы и статистика, 1985.

158. Циликов И.С. Разработка модели представления, методов и алгоритмов интеллектуальной обработки текста с целью его формализации в информационных системах. Автореф. . кандидата техн. наук: 05.13.01. — Санкт-Петербург, 2010.

159. Черняк Л. От информационно-поисковых систем к корпоративному поиску // Открытые системы. — 2005. — № 11. — http://www.osp.ru/os/2005/ll/380532/.

160. Шокин Ю.И., Белов С.Д., Чубарое Л.Б. Предварительные результаты тестирования создаваемой системы мониторинга и сбора статистики СПД СО РАН // Вычислительные технологии. — 2007. Т. 12. — № 5. - С. 126-134.

161. Шокин, Ю.И., Федотов A.M. Интеграция информационно-телекоммуникационных ресурсов Сибирского отделения РАН // Вычислительные технологии. — 2003. — Т. 8. — Специальный выпуск. — С. 161-171.

162. Шокин Ю.И., Федотов A.M. Информационная система Сибирского отделения РАН // Труды Второй всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" (RCDL'2000). — Протвино, 2000. С. 6-14.

163. Шокин Ю.И., Федотов A.M. Информационные ресурсы Сибирского отделения РАН // Информационные ресурсы России. — 1999. Т. 9. - № 4. - С. 12-16.

164. Шокин Ю.И., Федотов A.M. Информационные технологии Internet. // Вычислительные технологии. — 1997. — Т. 2. — 3.- С. 80-87.

165. Шокин Ю.И., Федотов A.M. Развитие распределенных информационно-вычислительных ресурсов в СО РАН // Вычислительные технологии. — 2004. — Т. 9. — Специальный выпуск.- С. 10-23.

166. Шокин Ю.И., Федот,ов A.M. Распределенные информационные системы // Вычислительные технологии. — 1998. — Т. 3. — № 5.- С. 79-93.

167. Шокин Ю.И., Федот,ов A.M., Барахнин В.Б. Особенности организации системы управления веб-контентом сайтов информационной поддержки инновационной деятельности // Вычислительные технологии. — 2005. — Т. 10. — Специальный выпуск. — С. 122-128.

168. Шокин Ю.И., Федот,ов A.M., Барахнин, В.Б. Технология создания программных систем информационного обеспечения научной деятельности, работающих со слабоструктурированными документами // Вычислительные технологии. — 2010. — Т. 15. -№ 6. С. 111-125.

169. Шокин Ю.И., Федотов A.M., Клименко O.A., Барахнин В.Б., Мазов H.A. Информационная система виртуального музея СО РАН // Труды IV Всероссийской научно-практической конференции "Информационные недра Кузбасса". — Кемерово, 2005.- С. 43-44.

170. Шрейдер Ю.А. Информация и метаинформация // Научно-техническая информация. Сер. 2. — 1974. — № 4. — С. 3-10.

171. Шрейдер Ю.А. К определению системы // Научно-техническая информация. Сер. 2. — 1971. № 7. - С. 3-8.

172. Шрейдер Ю.А. О количественных характеристиках семантической информации // Научно-техническая информация. Сер. 2.- 1963. № 10. - С. 35-39.

173. Шрейдер Ю.А. О семантических аспектах теории информации //В сб.: Информация и кибернетика. — М.: Советское радио, 1967. С. 15-47.

174. Шрейдер Ю.А. Об одной модели семантической информации// В сб.: Проблемы кибернетики. — Вып. 13. — М.: Наука, 1965. — С. 233-240.

175. Шрейдер Ю.А. Равенство, сходство, порядок. — М.: Наука, 1971.

176. Шрейдер Ю.А., Шаров А.А. Системы и модели. — М.: Радио и связь, 1982.

177. Электронная библиотека MathTrec. — http://www.mathtree.ru.

178. Электронный атлас биоразнообразия животного и растительного мира Сибири. — http://www.sbras.ru/win/elbib/bio/.

179. Ядов В.А. Потребности // Большая Советская Энциклопедия, изд. 3. М.: Советская Энциклопедия, 1975. Т. 20. - С. 439-400.

180. Янеико II.Н. Методологические вопросы современной математики // Вопросы философии. — 1981. — № 8. — С. 60-68.

181. Ackoff R., Emery F. On Purposeful Systems. Ch.-N.Y.: Aldine -Atherton, 1972. /Рус. пер. Акофф P., Эмери Ф. О целеустремленных системах — М.: Советское радио, 1974.

182. Alexander С. et al. A Pattern Language Towns, Buildings, Constructions. N.Y.: Oxford University Press, 1977.

183. Beck K., CunninghamW. Using Pattern Languages for Object-Oriented Programs // In: OOPSLA-87 Workshop on the Specification and Design for Object-Oriented Programming. — http: //c2.com/doc/oopsla87.htinl.

184. Berners-Lee Т., Fielding R., Masinter L. Uniform Resource Identifiers (URI). Generic Syntax // RFC 2396. 1999. -http: / / www.ietf.org/rfc/rfc2396.txt.

185. Berriier C.L. Correlative indexes II: Correlative trope indexes // American Documentation. 1957. — V. 8. — N° 1. - P. 47-50.

186. Bertalanffy L. von. Problems of General System Theory // Human Biology. 1951. - 23. - P. 302-312.

187. Bertalanffy L. von. Conclusion // Human Biology. — 1951. — № 23. P. 336-345.

188. Brillouin L. Science and information theory. — N.Y.: Academic Press, 1956. / Pyc.nep. Бриллюэн Л. Наука и теория информации. — М.: Физматгиз, 1960.

189. The CERIF (Common European Research Information Format) Standard. — http://www.eurocris.org/en/taskgroups/cerif/new6/ new0/C%3A%5CDocuments+and+Settmgs%5Ceg53%5CDesktop% 5CCERIF2000part2.pdf.

190. Chen P.P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. - № 1. - P. 9-36. / Рус. пер. Чей П. П.-Ш. Модель "сущность-связь" - шаг к единому представлению данных // СУБД. - 1995. - № 3. - С. 137-158.

191. Codd E.F. A relational model of data for large shared data banks // Comm. ACM. 1970. - V. 13. - № 6. - P. 377-387. / Рус. пер. Кодд E. Ф. Реляционная модель данных для больших совместно используемых банков данных // СУБД. — 1995. — № 1. — С. 145160.

192. Community Research and Development Information Service. — http: //cordis.europa.eu/.

193. The COSINE and Internet X.500 Schema // RFC 1274. -http://www.networksorcery.com/enp/rfc/rfcl274.txt.

194. Crescenzi V., Mecca G., Merialdo P. Roadrunner: Towards automatic data extraction from large web sites // In: The VLDB Journal. Rome, 2001. - P. 109-118.

195. Definition of the inetOrgPerson LDAP Object Class // RFC 2798. — http://www.faqs.org/rfcs/rfc2798.html.

196. Dublin Core Metadata Initiative. — http://dublincore.org/.

197. European Research Gateways Online. -http: / / www.cordis.europa.eu/ergo.

198. Gitt W. Ordnung und Information in Technik und Natur // In: Gitt W. (Hrsg.): Am Anfang war die Information. Gräfeling: Resch KG, 1982. S. 171-211.

199. Global Information Locator Service (GILS). — http://www.gils.net/.

200. Gruber T. A translation Approach to Portable Ontology Specifications // Knowledge Acquisition Journal. — 1993. — V. 5.- № 2. P. 199-220.

201. ISO/IEC 11179, Specification and Standardization of Data Elements. — ftp://sdct-sunsrvl.ncsl.nist.gov/x318/11179.

202. I spell Spell checker. - http://directory.fsf.org/ispell.html.

203. Krogstle J. HaJpin T., Siau K. Information Modeling Methods and Methodologies. — Idea group publishing, 2005.

204. Langefors B. Infologocal models and information user views // Information Systems. 1980. - № 5. - P. 17-32.

205. Langefors B. Managment information system design // I AG Quart.- 1969. V. 2 - M 4. - P. 5-17.

206. Langefors B. Some approaches to the theory of information systems // BIT. 1963. - № 3. - P. 229-254.

207. Leonova Yu. V., Barakhnin V.B., Fedotov A.A4. On the problem of modeling of the horizontal relations between documents // Вычислительные технологии. — 2007. — T. 12. — № 1. — С. 3-12.

208. Library of Congress. — http://www.loc.gov/.

209. Lightweight Directory Access Protocol (v3) // RFC 2251. -http: / / www.faqs.org/rfcs / rfc2251.html.

210. The MacTutor History of Mathematics archive. — http://www-history.mcs.st-and.ac.uk.

211. The Mathematics Genealogy Project. — http: / / www.genealogy.ams.org.

212. Mathematics Subject Classification. — http://www.ams.org/msc/.

213. Miller G.F. The Magical Number Seven, Plus or Minus Two // The Psychological Review. — 1956. — Vol. 63. — P. 81-97. / Рус. пер, Миллер Дж. Магическое число семь, плюс или минус два //В кн.: Инженерная психология. — М.: Прогресс, 1964. — С. 192— 225.

214. Price D.J, de Solla. Little Science, Big Science. — N.Y., L.: Columbia Univ. Press, 1963. / Рус. пер. Прайс Д. Малая наука, большая наука // Наука о науке. — М.: Прогресс, 1966. —■ С. 281-385.

215. Resource Description Framework (RDF) Model and Syntax Specification. W3C Recommendation 22 February 1999. — http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/.

216. Resource Resource Description Framework (RDF) Schema. Specification 1.0. W3C Candidate Recommendation 27 March 2000 http://www.w3.org/TR/2000/CR-rdf-schema-20000327/.

217. Roget P.M. Thesaurus of English Words and Phrases classified and arranged so as to facilitate the expression of ideas ahd to assist in literary composition. London, 1852.

218. Sahugvet A., Azavant F. Building intelligent web applications using lightweight, wrappers // Data Knowledge Engineering. — 2001. — V. 36. -m 3. P. 283-316.

219. Salton G. Automatic Information Organization and Retrieval. — N.Y.: McGraw-Hill Book Co., 1968. / Рус. пер. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. — М.: Советское радио, 1973.

220. Salton G. Dynamic Information and Library Processing. — N.J.: Prentice Hall, 1975. / Рус. пер. Солтоп Дою. Динамические библиотечно-информационные системы. — М.: Мир. 1979.

221. Schramm W. Information Theory and Mass Communication // In: Communication and Culture. — N.Y.: Holt, Rinehart & Winston, 1966. P. 521-534.

222. Segalovich I. A Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine // Proceedings of the International Conference on Machine Learning;

223. Models, Technologies and Applications. MLMTA:03, June 23-26, 2003, Las Vegas. Nevada, USA. CSREA Press, 2003. - S. 273-280.

224. Semantic Web. — http://www.w3.org/2001/sw/.

225. Staab S., Stuckenschmidt H. (Eds.). Semantic Web and Peer-to-Peer, Decentralized Management and Exchange of Knowledge and Information. — Springer, 2006.

226. Task Force on Metadata. Summary Report // American Library Association. — 1999. — T. June.

227. Top 300 R&D European Institutes. -http: / / research. webometrics.info/top300r&deurope.asp.

228. Universal Decimal Classification. — http://www.udcc.org/.280. vCard: The Electronic Business Card. ~~ http://www.imc.org/pdi/.

229. Web of Science. -http://wokinfo.com/productstools/multidisciplinary/wcbofscience/.

230. Webster's New World Dictionary of Computer Terms. 4th ed. — N.Y.: Prentice Hall, 1992.

231. Welly C. McGuinness D., Uschold M., Griming er M., Lehmann F. Ontologies: Expert Systems all over again // AAAI-T999 Invited Panel Presentation. — 1999.284. Zentralblatt MATH. http://www.zentralblatt-math.org/zmath/en/.

232. Zt.hes: a Z39.50 Profile for Thesaurus Navigation. http://lcweb.loc.gov/z3950/agency/profiles/zthes-04.html.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.