Архитектура и программная инфраструктура систем управления контентом и модели описания их функционирования тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат наук Иванов Алексей Владимирович
- Специальность ВАК РФ05.13.11
- Количество страниц 160
Оглавление диссертации кандидат наук Иванов Алексей Владимирович
Введение
1. Системы управления контентом. Обзор, сравнение, обоснование постановки задачи
1.1. Общие сведения
1.2. Классификация CMS
1.3. Механизмы работы CMS
1.3.1. Подсистема производства контента
1.3.2. Подсистема представления
1.3.3. Хранилище контента
1.3.4. Подсистема безопасности
1.3.5. Информационная архитектура
1.4. Технологии разработки
1.5. Обзор продуктов
1.6. Выводы по главе
2. Программная инфраструктура системы управления контентом
2.1. Методология проектирования
2.2. Сценарии использования
2.3. Постановка задачи и требования к программному решению
2.4. Выбор архитектурных решений
2.4.1. Использование каркасов приложений
2.4.2. Выбор программной платформы
2.4.3. Уровни программной архитектуры
2.4.4. Организация метаданных
2.4.5. Построение подсистемы представления
2.4.6. Построение хранилища контента
2.4.7. Реализация web-интерфейса управления CMS
2.4.8. Реализация архитектуры web-сервисов
2.4.9. Компонентный подход к формированию интерфейса пользователя
2.4.10. Обеспечение безопасности web-системы
2.4.11. Поддержка стандартов
2.4.12. Отображение динамической и статической информации
2.4.13. Интеграция данных из различных информационных источников
2.4.14. Расширение функциональности системы
2.5. Итоговая архитектура
2.6. Особенности применения каркасов web-приложений
2.7. Алгоритмы выполнения типовых задач
2.8. Структура программных модулей
2.9. Выводы по главе
3. Математические модели базовых процессов функционирования Информационного web-портала
3.1. Задачи моделирования процессов функционирования
3.2. Моделирование выполнения запросов информационными источниками
3.2.1. Модель формирования оценки эффективности
3.2.2. Модель определения параметров в задаче оценивания эффективности источника
3.2.3. Пример экспертного оценивания параметров модели
3.3. Моделирование активности пользователей
3.3.1. Модель формирования оценки активности пользователей
3.3.2. Модель определения параметров в задаче оценивания активности пользователей
3.3.3. Пример экспертного оценивания параметров модели
3.4. Выводы по главе
4. Примеры внедрения
4.1. Информационный web-портал Российской академии наук
4.2. Учебный портал
4.3. Оценивание вероятностно-временных характеристик программной системы на базе Информационного web-портала
4.3.1. Целевые показатели функционирования
4.3.2. Модель компонента программного обеспечения
4.3.3. Программное обеспечение для имитационного моделирования
4.4. Выводы по главе
Заключение
Список литературы
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Автоматизация разграничения перекрёстного доступа к информационным ресурсам корпоративных порталов: на примере газотранспортных предприятий2013 год, кандидат наук Демидов, Александр Владимирович
Комплекс программных средств разработки и поддержки информационного портала корпоративной системы2007 год, кандидат технических наук Войтиков, Константин Юрьевич
Математическое и программное обеспечение проектирования Интранет-интерфейсов при конкурентной разработке информационных систем2012 год, кандидат технических наук Соляник, Андрей Анатольевич
Многоуровневая масштабируемая архитектура контроля доступа к сервисам вычислительного комплекса в цифровой среде2022 год, доктор наук Магомедов Шамиль Гасангусейнович
Разработка и исследование принципов построения вертикальных образовательных порталов с открытой архитектурой2008 год, кандидат технических наук Силаев, Антон Валерьевич
Введение диссертации (часть автореферата) на тему «Архитектура и программная инфраструктура систем управления контентом и модели описания их функционирования»
Введение
В настоящее время системы управления контентом (Content Management Systems, CMS) - это компонент многих информационных систем, имеющий самостоятельное функциональное значение. Такие системы служат основой для управления публикацией информации на web-сайтах, в порталах, электронных СМИ и цифровых библиотеках. Хотя системы управления контентом часто ассоциируются исключительно с web-публикацией, что обусловлено спецификой формирования контента и широким распространением этих систем в Интернет, на самом деле область их применения существенно шире и охватывает большой спектр как Интернет, так и Интранет-приложений, где они используются в качестве инструментов подготовки контента, публикации и коллективной работы над документами.
Необходимость в системах управления контентом возникает при построении многих интегрированных информационных систем и, в первую очередь, порталов. Портал - универсальное средство, технология доступа к распределенным системам, в частности к информации, получаемой как из внешних источников, так и из собственного хранилища [46]. Подготовка и управление жизненным циклом информации в собственном хранилище портала как раз и требует использования системы управления контентом (встроенной в портал или внешней). О тесной связи порталов и CMS высказывались многие крупные производители программного обеспечения. Аналитик компании «The Yankee Group» Роб Перри: «Управление информационным наполнением и порталы тесно связаны между собой, поскольку назначение систем CMS в том, чтобы довести информационное наполнение до web-приложения. CMS играет ключевую роль в создании материалов, которые смогут затем эффективно использоваться приложениями» [32]. Вице-президент отделения порталов компании «Interwoven» Том Стединг: «CMS имеет определяющее значение для порталов, но в то же время — это сугубо специфическая область с программным обеспечением самого высокого уровня сложности». Директор отделения системных решений компании «Open Market» Джефф Эрнст: «Без управления информационным наполнением в методике построения порталов образуется существенный пробел. Очень важно, что
производители систем CMS начинают сами устанавливать партнерские отношения с целью обеспечить глубокую интеграцию».
Построение интегрированных информационных систем является сложной инженерной задачей, требующей значительных усилий по организации эффективного взаимодействия образующих эти системы компонентов. В данном случае системы управления контентом являются сложным объектом, поскольку долгое время отсутствовали какие-либо стандарты по организации их взаимодействия с другими системами, а архитектуры большинства систем были закрытыми.
В последние годы появляется все больше систем, построенных по открытой архитектуре. Также появился ряд стандартов, регламентирующих взаимодействие с приложениями для создания контента, обмена контентом между различными системами, а также взаимодействия с рядом внутренних компонентов систем управления контентом, однако пока нельзя говорить ни о достаточности данной работы, ни о широкой поддержке этих стандартов.
В процессе эволюции систем управления контентом был выработан ряд протоколов и стандартов, применяемых при построении подсистемы производства контента:
- Web-based Distributed Authoring and Versioning (WebDAV) [106] -протокол для поддержки коллективного редактирования и управления файлами на удаленных серверах. Протокол поддерживается многими приложениями (например, Microsoft Word), что позволяет интегрировать эти приложения с CMS, обладающими поддержкой протокола WebDAV, и использовать для создания и редактирования контента;
- Dublin Core [67] - набор стандартов для описания web-ресурсов с помощью метаданных;
- Open Document Management API (ODMA) [89] - стандарт для взаимодействия клиентов с системами управления документами (DMS);
- Docbook [63] - XML схема для структурированного представления книг
и U T-v
и статей технической направленности. В настоящее время практически вытеснен стандартом DITA;
- Darwin information typing architecture (DITA) [61, 62] - стандарт для структурированного представления контента с помощью основанного на XML языка, описывающий структуру, идентификацию, представление метаданных и ссылок, правила форматирования различных видов информации. Данный стандарт используется при реализации компонентного управления контентом.
Ограниченная совместимость и приспособленность к интеграции существующих систем управления контентом делает оправданной, актуальной, а зачастую и единственно возможной разработку собственных систем. Хотя система управления контентом - продукт высокого уровня сложности, преимущества, которые дает реализация собственной, адаптированной под реальные потребности архитектуры конкретной информационной системы, могут превысить трудности разработки.
Так, например, портал Российской академии наук www.ras.ru содержит более 40000 документов и информацию о 20000 персон и 2100 организациях. Данный объем информации по сравнению с сайтами крупных корпораций является незначительным, и для управления им можно было бы использовать практически любую популярную CMS. Однако портал также предоставляет доступ к 6 базам данных с материалами архива РАН, общим объемом более 160 Гбайт, мультимедийному архиву, архиву номеров журнала «Вестник РАН», серии электронных коллекций по научному наследию, и другим ресурсам, обеспечивая возможности атрибутного поиска по их содержимому. Кроме того, в портал интегрирован ряд информационных систем Президиума РАН. Реализация функциональных возможностей, требующихся для управления такими разнообразными информационными системами, во многих CMS не только потребовала бы значительных усилий по разработке, но и выявила бы их внутренние ограничения, потребовав взаимодействия с производителями этих систем. А такой сценарий уже мало отличается от разработки собственной системы.
Таким образом, задачи анализа, обобщения и практической реализации современной CMS, ориентированной на применение в структуре сложной интегрированной информационной системы, являются весьма актуальными.
В первых двух частях диссертационной работы изложено решение указанных задач применительно к CMS, предназначенной для применения в составе порталов, в частности в составе интеграционной платформы Информационного web-портала. Информационный web-портал - это разработка, выполненная в ФИЦ ИУ РАН [41], и использованная в ряде проектов. Также в них отражено решение задачи сопровождения конечного программного средства, в данном случае заключающейся в обеспечении эффективного управления постоянно растущим массивом контента, расширением состава различных внешних информационных источников, а также организации доступа к ним.
Разработка CMS, как и любого другого программного продукта высокого уровня сложности, требует существенных усилий на отладку и тестирование. Большое значение в процессе разработки играют правильная постановка задачи, анализ требований к подлежащему реализации функционалу, сценариям и условиям использования, возможностям программных и технических платформ, ожидаемым нагрузкам. Во многом требования определяют рациональный выбор программных платформ и паттернов проектирования, позволяющих снизить трудозатраты. Не менее важной является организация итогового тестирования продукта, позволяющего выявить часть программных ошибок и определить работоспособность продукта при расчетных нагрузках.
Однако в силу того, что CMS - многопользовательская система, взаимодействие с которой осуществляет несколько групп пользователей (авторы контента, потребители контента, администраторы), использующих различный функционал системы и создающих принципиально различную нагрузку на систему, существует проблема создания адекватной тестовой нагрузки.
В силу того, что CMS входит в состав гетерогенной системы, включающей компоненты, построенные с использованием различных программных платформ, а также унаследованные компоненты, механизмы работы компонентов с программными ресурсами могут отличаться. Также отличаются и средства предупреждения, диагностики и обработки ошибок, что приводит к различному поведению компонентов системы в случае возникновения утечек ресурсов и программных отказов. Это создает предпосылки к возникновению ошибок управления ресурсами, вызванных совместной работой компонентов.
В результате изменение характера нагрузки может влиять на устойчивость системы и приводить к возникновению отказов, не диагностируемых при стационарном характере тестовой нагрузки. Кроме того, возможность моделировать разные режимы формирования этой нагрузки (быстро, медленно, с переходными процессами, постепенным и реактивным нарастанием) представляется вполне полезной при исследовании режимов и характеристик работы всех составляющих систему компонентов, их конфигурировании и оптимизации.
Вопросам организации тестовой нагрузки обычно уделяется недостаточное внимание, распространенные инструменты предлагают создать определенный поток запросов, соответствующий расчетному или стрессовому уровню нагрузки. Компании уровня Google обладают значительными накопленными шаблонами нагрузок, которыми пользуются при тестировании внутренних разработок [93], однако такие возможности не доступны рядовым разработчикам. Сложность организации нагрузки связана с тем, что крайне трудно предположить поведение будущих пользователей. Хотя число пользователей и поддается оценке, основная трудность состоит в определении их ожидаемой активности, т.е. частоты обращений к системе, смене уровней активности, различии уровней активности и характере перехода от одного уровня активности к другому.
Для формализации задачи организации тестовой нагрузки в настоящей работе предлагается рассматривать пользовательскую активность как носящую случайный характер. При этом активность изменяется во времени. Традиционно применяемые линейные регрессионные модели не позволяют описать ее удовлетворительно. В связи с этим представляется обоснованным обратиться к аппарату стохастических динамических систем.
Естественно, предлагаемые модели должны согласовываться с опытными данными, полученными при работе программного решения. Для этого рассматриваемая в настоящей работе CMS была оснащена средствами сбора характеризующих пользовательскую активность данных. В данном случае наличие собственного решения дало преимущество за счет возможности инструментирования внутренних компонентов и сбора всей интересующей информации. В результате был собран существенный объем данных, позволяющий
оценить адекватность предлагаемых моделей. Третья глава настоящей работы посвящена моделированию пользовательской активности. На основе экспертного анализа полученных данных была предложена модель пользовательской активности в форме стохастической динамической системы с дискретным временем. Изначально заложенное в модель предположение о существовании типичных состояний пользовательской активности позволило достаточно детально управлять параметрами модели и обеспечить адекватность моделируемой активности реально наблюдаемым данным.
Такое моделирование было применено на практике для тестирования программного решения. Было создано отдельное приложение, формирующее поток запросов, выбираемых из заранее сформированного для выбранных компонентов системы представительного блока запросов, в соответствии с предложенной моделью активности пользователей. Работа системы протоколировалась, полученные данные использовались для принятия решения о работоспособности компонентов, поиска и устранения ошибок.
Следует отметить, что такой поход к тестированию является новым, стохастические модели для формирования тестовой нагрузки сколь-нибудь существенно не применялись. Более того, подход оказывается эффективным (что обосновывает его перспективность как практическую, так и дальнейшего теоретического развития) и в других задачах. Так, в рамках диссертации рассмотрена еще одна задача, связанная с анализом состояния внешних источников информации портала.
CMS предоставляет доступ не только к собственному хранилищу, но и к внешним источникам информации, данные о состоянии и характеристики быстродействия которых системе не известны, и могут меняться в широких пределах. В частности, обращение к информационным источникам приводит к необходимости межпроцессного взаимодействия, в отличие от большинства других задач, работающих с объектами в памяти процесса web-сервера, что само по себе меняет величины быстродействия на порядки.
Так, например, у реляционных информационных источников, реализуемых, как правило, на основе сервера баз данных, можно наблюдать сложное поведение времени выполнения запроса в зависимости от внутреннего состояния,
определяемого наличием данных в кэше, уровнем загрузки аппаратных ресурсов и телекоммуникационной составляющей, а также сложности запроса. Один и тот же запрос может выполняться разное время при разных состояниях такого источника. Наибольший же вклад в неопределенность вносят действия пользователей, поскольку состав требующихся им информационных источников, интенсивность и структура формируемых ими запросов не могут быть определены заранее [21].
В связи с перечисленным возникает необходимость оценки эффективности выполнения запросов. Такая оценка может служить основой для минимизации влияния времени выполнения запросов на работу системы и повышения эффективности использования ее ресурсов. Для получения этой оценки необходимы соответствующие модели. В диссертационной работе такие модели предлагается формировать по тем же принципам, что и модели организации тестовой нагрузки.
Чтобы предлагаемые модели согласовывались с опытными данными, полученными при функционировании реального продукта, как и в случае с задачей организации тестовой нагрузки, CMS была инструментована для сбора таких данных. Был собран существенный объем данных, позволяющий оценить адекватность предлагаемых моделей. На основе экспертного анализа полученных данных была предложена модель показателя эффективности источника в форме стохастической динамической системы с дискретным временем. Полученная модель, не имея прямого отношения к CMS, может быть использована другими компонентами портала для оптимизации своего функционирования. Разработка таких алгоритмов рассмотрена в [5]. В частности, показано, что поскольку время выполнения запросов источниками может существенно отличаться, а количество одновременно выполняющихся запросов ограничено доступными ресурсами системы, то оптимальное распределение запросов во входных очередях источников может влиять на общую эффективность Информационного web-портала.
Подводя итог, можно окончательно определить, что объектом исследований диссертации являются модели для анализа функционирования программных систем (в частности CMS) под нагрузкой, имитирующей пользовательскую активность, процессы и алгоритмы проектирования, применявшиеся в ходе создания собственного программного решения. Для анализа
было предложено использовать модели на основе стохастических динамических систем.
Предложенные в работе модели являются основой для решения задач повышения эффективности и надежности процессов обработки данных в подсистемах Информационного web-портала, включая моделирование и организацию тестовой нагрузки.
Разработанное программное обеспечение имеет самостоятельное практическое значение и было использовано в целом ряде информационных систем.
Предмет изучения составляют программная инфраструктура портальной CMS и информационные процессы, влияющие на ее функционирование.
Основной целью работы является разработка концепции интегрированной портальной CMS, ее реализация в виде функционирующей программной системы, обеспечивающей управление web-контентом в составе интеграционной платформы Информационного web-портала, и описание среды функционирования этой системы адекватными математическими моделями. Для достижения цели исследования требуется решить следующие задачи:
- проанализировать и сравнить существующие подходы к реализации систем управления web-контентом, сформировать требования к системе управления web-контентом, входящей в состав web-портала;
- разработать архитектуру и программную реализацию компонентов системы и выполнить их внедрение в среду web-портала;
- сформировать универсальный подход к описанию состояния среды функционирования CMS, на основе которого предложить адекватные математические модели;
- проверить адекватность предложенных моделей реальным данным и проанализировать применимость моделей в реальных проектах (т.е. возможности их использования для задач тестирования и оптимизации функционирования).
Для решения поставленных задач в диссертации использовались современные методы проектирования программных систем. Основной подход -объектно-ориентированное проектирование и анализ алгоритмов и программ.
Кроме этого, применялись принципы построения сервис-ориентированной архитектуры (Service OA).
Реализационные подходы, положенные в основу проектных решений, включают методы объектно-ориентированного программирования, компонентный подход к разработке программ, а также стандарты и спецификации Open Management Group (UML, PKI) [88], World Wide Web Consortium (HTML, CSS, XML, WSDL, SOAP) [73, 56, 68, 105, 95], European Computer Manufacturers Association (JavaScript), Internet Engineering Task Force (RFC), развиваемые в рамках концепций семантического веб.
Методическую основу исследования в части задач моделирования (среды функционирования CMS и модели показателя эффективности информационного источника) обеспечивает теория стохастических динамических систем. Для анализа имеющихся массивов данных, накопленных по результатам наблюдений за внедренным продуктом, использованы методы математической статистики.
Научная новизна. В работе автором самостоятельно получены новые теоретические и научно-технические результаты, среди которых можно выделить следующие:
- выполнены проект и разработка самостоятельной CMS;
- предложен, исследован и реализован подход к моделированию и организации тестовой нагрузки;
- предложен и исследован подход к моделированию состояния информационных источников.
Практическая значимость полученных результатов подтверждается рядом выполненных проектов - внедренных в практическую деятельность информационных систем, в которых была применена созданная CMS. Результаты диссертации применены в программе Президиума РАН «Информатизация» (20012010 гг.), учебном портале (2008-2010 гг.), а также серии проектов, выполняемых ФИЦ ИУ РАН в рамках работ по созданию систем специального назначения.
Действующие реализации программного решения, а также существенные объемы статистических данных, полученных в ходе организации нагрузочного тестирования, подтверждают достоверность полученных в диссертации результатов.
Апробация работы. Основные положения и результаты диссертационной работы докладывались на конференциях и семинарах:
- «Информационное обеспечение науки», Таруса, 2003;
- II научная сессия ИПИ РАН, 2005;
- восьмая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», Суздаль, 17-19 октября 2006;
- XII Российская конференция с международным участием «Распределенные информационно-вычислительные ресурсы» (DICR2008), Академгородок, Новосибирск, 5-7 ноября 2008;
- XI Всероссийский симпозиум по прикладной и промышленной математике (весенняя сессия), Кисловодск, 1-8 мая 2010.
Кроме того, подходы, отраженные в работе, неоднократно представлялись на научных семинарах в ФИЦ ИУ РАН, ВЦ РАН, МСЦ РАН, ИСА РАН.
Публикации. По теме диссертации автором опубликовано 14 работ, 8 из них опубликованы в рецензируемых научных изданиях, рекомендованных ВАК. Получено свидетельство о регистрации программы для ЭВМ.
Структура и объем работы
Диссертация состоит из введения, четырех глав, заключения и списка литературы.
В первой главе приводится назначение, область применения и классификация систем управления контентом.
Во второй главе рассматривается архитектура и практическая реализация
CMS.
В третьей главе рассматриваются математические модели процессов функционирования CMS в составе Информационного web-портала.
Четвертая глава посвящена примерам практического применения разработанной CMS.
В заключении приводятся основные выводы и результаты, полученные в ходе диссертационной работы.
1. Системы управления контентом. Обзор, сравнение, обоснование постановки задачи
1.1. Общие сведения
Прежде чем дать основные определения, следует упомянуть, что управление контентом - сравнительно новая область информационных технологий, и многие используемые в этой области термины являются слишком общими, либо используются бессистемно.
Чак Рассел (соучредитель Collective Intelligence Inc.) определяет термин «управление контентом» как совокупность процессов и технологий по поддержке жизненного цикла цифровой информации, также называемой контентом. Важно, что данное определение рассматривает управление контентом как совокупность технологий и процессов. Аналитики [82, 103] отмечают, что многие аспекты управления контентом лежат вне технологической плоскости.
Термин «контент» первоначально обозначал неструктурированную информацию, используемую в web-приложениях [107], однако, поскольку продукты для управления контентом стали применяться для управления и другими видами информации, интерпретация этого термина расширилась. Под контентом понимаются представленные в цифровой форме: структурированная информация (записи баз данных, xml-документы), частично структурированная информация (формы, сообщения электронной почты) и неструктурированная информация (текстовые документы, изображения, аудио и видео материалы). Иными словами, любая информация в некотором цифровом представлении.
Жизненный цикл контента описывает стадии его существования в цифровой форме. На данный момент нет единого мнения о числе и составе его стадий. Так, например, в отчете [52] насчитывается пять стадий: создание, проверка, хранение, публикация и архивирование. В [51] выделяется три стадии: накопление, управление и публикация. Аналитики организации CMSWatch идентифицируют только две: производство и публикацию. Наконец, в работе [66] предлагается семь стадий: организация, создание, хранение, документооборот, ведение версий, публикация и архивирование. Можно выделить только две стадии, в отношении
которых все авторы единогласны - это создание (накопление, производство) контента и его публикация.
Управление контентом - изначально коллективный процесс. Его участники имеют определенные роли:
- авторы создают и редактируют контент;
- редакторы контролируют стиль и подачу информации, а также занимаются переводом и локализацией;
- выпускающие редакторы отвечают за публикацию контента;
- администраторы управляют назначением прав доступа к контенту участников процесса и осуществляют другую поддержку;
- пользователи или потребители получают опубликованный контент. Системы управления контентом и являются теми средствами, с помощью
которых автоматизируется процесс управления контентом. Поскольку управление контентом состоит в обеспечении его жизненного цикла, системы управления контентом должны иметь адекватные средства для поддержки всех его стадий и обеспечения ролевого принципа коллективной работы.
1.2. Классификация CMS
Прежде всего определим место, занимаемое системами управления контентом, среди других категорий программного обеспечения, используемого для управления информацией (Information Management). Несмотря на то, что программное обеспечение для управления информацией строится на общих принципах, оно разделяется на ряд категорий, в соответствии с видами информации и спецификой их обработки. Различают [54, 70, 83]:
- Document Management (DM) - управление документами;
- Web Content Management (WCM) - управление web-контентом;
- Knowledge Management (KM) - управление знаниями (сохранение и распространение в формализованном виде знаний от одних сотрудников предприятия другим);
- Digital Assets Management (DAM) - управление цифровыми активами
/ 1 U U 1 U 1 t» \
(графической, мультимедийной информацией, файлами);
- Software Configuration Management (SCM) - управление текстами программ;
- Digital Rights Management (DRM) - управление правами использования распространяемого в цифровом виде контента;
- Records Management (RM) - управление записями, учетной, аудиторской информацией, хранение которой регулируется нормативами;
- Learning Management (LM) - управление очным или дистанционным обучением (учебными планами, данными посещаемости и т.д.);
- Product Data Management (PDM) - управление данными об изделии (иногда называется Product Information Management).
Первоначально, области применения этих категорий программного обеспечения не пересекались и развитие программных продуктов шло независимо. Однако в дальнейшем стало происходить заимствование функциональности между продуктами разных категорий, а границы между категориями размылись. Системы управления контентом занимают особое положение в этом списке, поскольку вобрали в себя те или иные черты всех остальных категорий (KM, DM, DAM, SCM, DRM, RM, LM и PDM) и являются на данный момент наиболее востребованным продуктом для управления цифровой информацией [54].
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Онтологические модели в автоматизированном проектировании корпоративных порталов2007 год, кандидат технических наук Подобуев, Андрей Геннадиевич
Технология интеграции данных в гетерогенных корпоративных программных комплексах2017 год, кандидат наук Зыков, Сергей Викторович
Развитие методов и моделей формирования интеллектуального контента2012 год, кандидат экономических наук Евсюткин, Александр Сергеевич
Методы и модели защиты корпоративных информационных систем от комплексных деструктивных воздействий2020 год, кандидат наук Левоневский Дмитрий Константинович
Технология построения проблемно-ориентированных сред для научных исследований в рамках модели персонального облака2013 год, кандидат наук Чуров, Тимофей Николаевич
Список литературы диссертационного исследования кандидат наук Иванов Алексей Владимирович, 2018 год
Источник a b
ISIR 0,1 -83,0 50,5
Archives 0,2 -20,0 23,6
FStorage 0,3 0,725 19,9
Таким образом, сформированы модели для всех выбранных информационных источников портала.
Для источника КШ. получены следующие уравнения процессов:
гь = 0,1 • гс-1 - 83 + 50,5 • т = + Е(п) • <рс,
(0,0374, -от < х < -10 D(x) = j 0,311, -10 < х < 10 , ( 1, 10 < х < +от
(0,0334, —от < х < -10 Е(х) = j 0,0698, -10 < х < 10 . I 1,18, 10 < х < +от
Результат моделирования приведен на рис. 20.
Рис. 20 Фрагмент смоделированных наблюдений источника ISIR
Для источника Archives получены следующие уравнения процессов:
rt = 0,2 • rt-1 - 20 + 23,6 • = D(rt) + E(rt) •
(0,0931, -от < х < -10 Dfr) = j 0,296, -10 < х < 10 , 0,683, 10 < х < +от
(0,0344, -от < х < -10 Е(х) = j 0,0749, -10 < х < 10 . 0,747, 10 < х < +от
Результат моделирования приведен на рис. 21.
Рис. 21 Фрагмент смоделированных наблюдений источника Archives
Для источника FStorage получены следующие уравнения процессов: rt = 0,3 • rt-1 + 0,725 + 19,9 • = D(rt) + E(rt) •
(0,0774, -от < х < -10 D(х) = j 0,275, -10 < х < 10 , ( 1,03, 10 < х < +от
(0,0496, -от < х < -10 Е(х) = j 0,0617, -10 < х < 10 . 0,541, 10 < х < +от
Результат моделирования приведен на рис. 22.
mt з
2,5
О 20 40 60 80 100 120 140 160 180 200
Рис. 22 Фрагмент смоделированных наблюдений источника FStorage
Полученные модели обеспечивают значения статистических параметров (среднее значение и среднеквадратическое отклонение) каждого режима эффективности источников и частот отнесения источника к режиму вБ, вС, вМ, близкие к параметрам наблюдений. Время непрерывного нахождения источника в определенном режиме эффективности моделируется с недостаточной точностью, что может объясняться недостаточной точностью выбора параметра a, либо неудачным выбором в качестве случайного возмущения процесса (4) гауссовского шума [21].
3.3. Моделирование активности пользователей
Активность пользователей, то есть число пользователей, работающих с web-системой в момент времени , является важным фактором, определяющим требования к любой web-системе. Большая часть технических решений, применяемых при проектировании web-систем, так или иначе связана с минимизацией использования ресурсов при номинальной нагрузке и сохранением работоспособности при высокой нагрузке (активности пользователей) [21].
Активности пользователей присущи две отличительные особенности:
- наличие явно выраженного периодического изменения активности, связанного с содержанием источника. Например, максимальная посещаемость сайтов государственных учреждений наблюдается в рабочие дни, в то время как развлекательные сайты наиболее загружены в выходные и праздничные дни. В реальных наблюдениях можно обнаружить суточные изменения активности (день / ночь), недельные (рабочие / выходные дни) и годичные [21];
- наличие спонтанных всплесков активности, связанных с появлением на ресурсе контента, вызывающего интерес непосредственной аудитории сайта, либо появлением ссылки на этот контент на другом высоко посещаемом ресурсе (так называемые «SlasMot-эффект» или «Хабраэффект», получившие название от соответствующих сайтов [96]). Эффект состоит в том, что в отдельные промежутки времени интерес пользователей (активность) к определенному сайту скачкообразно меняется, остается относительно постоянным некоторое время, а затем изменяется вновь. При этом можно принять активность на таком промежутке времени в некотором смысле постоянной (изменяющейся сравнительно мало). Высокий уровень активности может быть также вызван хакерской атакой на сайт [5, 21].
Попытка моделирования периодических колебаний активности излишне усложняет модель и их влияние целесообразно исключить. Этого можно добиться, например, выделив в наблюдаемых данных период колебаний, определив усредненный уровень активности для этого периода (тренд) и вычтя его из наблюдаемых данных. Затем полученную разность с линией тренда можно использовать в качестве исходных данных для идентификации параметров модели. В дальнейшем, результаты моделирования должны быть объединены с полученным трендом, чтобы получить абсолютные значения активности [21].
Особенность Информационного web-портала состоит в том, что одно обращение (запрос) пользователя может порождать несколько обращений к информационным источникам. Это объясняется как логикой самих запросов, так и возможностью пользователя в ряде случаев напрямую указывать список источников, участвующих в выполнении запроса [21].
Портал осуществляет взаимодействие с источниками с помощью команд, представляющих собой формализованные сообщения [14, 21]. Поскольку для не выполнивших аутентификацию пользователей подсистема интеграции и поиска не
может определять принадлежность команд запросам пользователей, вместо числа пользователей приходится использовать оценку, формируемую по результатам косвенных наблюдений. В качестве последних можно использовать лишь общее число команд, выполненных подсистемой интеграции и поиска за определенный интервал времени [21].
3.3.1. Модель формирования оценки активности пользователей
Для модели показателя активности пользователей, как и для модели показателя эффективности источника используется дискретное время. Интервал наблюдения [Ь0; разбивается на отрезки Ь0 < Ь1 < Ь2 < ••• < Ьк-1 < Ьк < •••. На текущем отрезке ( Ьк-1; Ьк] измеряется количество выполненных порталом команд щ. Длина интервала выбирается из тех же соображений, что и в случае моделирования показателя эффективности источника [5, 21].
Для описания динамики показателя щ было бы допустимо использовать уравнение авторегрессии первого порядка:
Щ = / • Щ-1 + 9 + Ъуг, (7)
где Ь - известная величина, ус - стандартный дискретный белый шум, и0 -случайная величина, не зависящая от , в предположении, что среднее число команд (задаваемое коэффициентами / ид) остается постоянным, а возможные отклонения от этого среднего моделируются с помощью шума . Однако такую модель нельзя считать адекватной из-за наличия упомянутых выше спонтанных всплесков активности пользователей [21].
Чтобы учесть в модели существование всплесков активности, как и в случае с моделью эффективности источника, воспользуемся идеей классификации рассматриваемого показателя щ.
Считая, что в любом режиме число команд ис можно описать уравнением авторегрессии первого порядка, то есть, при смене режима модель не изменяется, меняются лишь параметры /,д,Ь, можно ввести функции Р(х), в(х), В(х), возвращающие значения параметров авторегрессии в зависимости от текущего режима, определяемого значением показателя щ.
Таким образом, в качестве модели, описывающей динамику показателя активности пользователей, предлагается следующая стохастическая динамическая система общего вида [21]:
щ = + + = 1,2,
(8)
где область значений Л1 показателя щ разбита на непересекающиеся интервалы
точками й: —го = < ^ < ••• < < = +го
1
я -
число режимов
интенсивности поступления команд, функции ^(х), С(х) и В(х):
Ях) =
—го < х < й < X < й2
,С(х) =
С1, —го < х < й1 С2, й < х < й2
1 < х < +го йп—1 < х < +го
^ —го < х <
В(х) =
(9)
52, й < х < й2
ч5п, йп—1 < х < +го
Использование такой модели можно иллюстрировать следующим примером. Предположим, что существует несколько (например, три) режимов интенсивности поступления команд [21]:
- 0Н - режим низкой интенсивности;
- 0О - режим обычной (повседневной) интенсивности (описывается средним характерным числом команд, формируемых пользователями, регулярно использующими портал);
- 0В - режим высокой интенсивности.
В качестве граничного значения режима низкой интенсивности выберем число 10, а режима средней интенсивности - число 100. Соответственно три интервала ДН,ДО,ДВ будут определены как: ДН = (—го, 10], ДО = (10,100], ДВ = (100, +го). Тогда функции ^(х), С(х) ий(х) можно определить как [21]:
% —го < х < 10
в.
—го < х < 10
^(х) = { ^о, 10 < х < 100, С(х) = { СО, 10 < х < 100,
100 < х < +го
1СВ, 100 < х < +го
(10)
ВН, —го < х < 10 Я(х) = {ВО, 10 < х < 100 , 1вВ, 100 < х < +го
{
{
{
где РН, РО, РВ и вО, - значения, определяющие среднее число команд, поступающих в соответствующем режиме, ВН,ВО,ВВ - значения, определяющие величину отклонения фактического числа команд от среднего уровня в текущем режиме.
Полученную модель (8) будем использовать для описания наблюдений щ, получаемых после вычитания из исходных данных периодической составляющей (тренда). Режимы вН,вО,вВ в этом случае рассматриваются не как абсолютные уровни активности, а степени отклонения текущего уровня активности от типично наблюдаемого [21].
3.3.2. Модель определения параметров в задаче оценивания активности пользователей
В предыдущем пункте модель показателя активности пользователей построена в предположении, что значения Р±,... ,Рп,С1,... ,Сп,В1,... ,Вп известны. Процедура выбора этих параметров реализуется с использованием тех же соображений, что и в описанной ранее задаче оценивания эффективности источника [21].
В частности, параметр / должен быть выбран исходя из обеспечения устойчивости авторегрессии, что имитирует предположение о наличии стационарного режима активности пользователей. Следует обратить внимание, что это предположение выдвигается в отношении «очищенных наблюдений». Исходные наблюдения активности имеют явный периодический характер, поэтому в их отношении предположение о стационарности выдвинуто быть не может. Однако периодическая составляющая может быть выделена как усредненное значение наблюдений за период колебаний (тренд). После этого исходные наблюдения можно «очистить», центрируя их заранее вычисленным трендом. Предположение о стационарности процесса щ подразумевает, что его среднее значение не должно изменяться, т.е. -[щ^] = = д/(1 — /) Также должна
оставаться постоянной и дисперсия щ, т.е. 0[щк] = 0[щк1] = Ь2/(1 —/2). Оценки среднего значения процесса М[щ] и дисперсии 0[щ] доступны из непосредственных наблюдений числа выполненных команд, поэтому значения g и Ь могут быть получены тривиально [21].
Однако, имея некоторый интервал и значения наблюдений в этом интервале, невозможно с приемлемой точностью оценить значения М[и^ и поскольку
содержащиеся в интервале наблюдения являются существенным усечением наблюдаемого процесса и не образуют выборку. Чтобы избежать этого, необходимо расширить границы интервалов, возможно, допустив их некоторое перекрытие [21].
Отметим, что в предыдущей модели аналогичная ситуация компенсировалась тем, что в окрестности выбранных границ попадает незначительное число наблюдений, которые были просто проигнорированы [21].
В то же время, расширение интервалов приводит к попаданию в выборку большого числа значений, которые находятся вблизи границы между режимами и не могут быть однозначно отнесены к тому или иному режиму, что приводит к искажению оценок. В связи с этим, при определении среднего значения и дисперсии следует использовать только те наблюдения, которые соответствуют нахождению портала в выбранном режиме дольше некоторого порогового значения, например, 100 минут. Каждому такому фрагменту траектории назначается вес, пропорциональный длине фрагмента [21]. Чтобы исключить произвольный выбор величины /, оценку / можно получить из уравнений Юла-Уокера [31]:
/ = 4, (11)
б
где £ - оценка коэффициента автоковариации, определяемая как £ = ЕГ=2 , Б - оценка дисперсии, определяемая как Б = ЕГ=1Щ2, Т -
Т—1 Т—1
длина интервала наблюдений.
3.3.3. Пример экспертного оценивания параметров модели
Проиллюстрируем применение процедуры экспертного оценивания на примере Информационного web-портала Российской академии наук. В данном случае была собрана статистика количества выполненных порталом команд. Измерялось суммарное число выполненных команд на временном интервале 10 минут. После удаления нулевых значений размер выборки составил 11507 наблюдений [21]. Исходные данные показаны на рис. 23.
900 -800 -700 -600 -500 -
0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200
Рис. 23 Фрагмент наблюдений числа выполненных команд
Можно увидеть наличие ежесуточных (144 интервала = 24 часа) и еженедельных колебаний активности [21].
По полученной выборке был определен усредненный уровень (тренд) числа выполненных команд, охватывающий временной интервал в 1 неделю. Для этого исходная выборка была разбита на фрагменты длительностью 1 неделю (11 фрагментов по 1008 наблюдений). Для каждого момента времени из каждого полученного фрагмента было взято по 1 наблюдению и определено медианное значение [21]. Данные тренда показаны на рис. 24.
Рис. 24. Данные тренда числа выполненных команд
Далее данные тренда были растиражированы вдоль всего интервала наблюдений и вычтены из исходных данных. Полученные данные (рис. 25) были использованы в качестве исходных реализаций щ для определения параметров модели [21].
Рис. 25. Фрагмент наблюдений после вычитания тренда
Далее были выбраны интервалы, соответствующие режимам 0Н, 00,0В. Очевидно, что наблюдения, соответствующие режиму обычной активности, после вычитания тренда будут сосредоточены вблизи 0. Превышение этого уровня соответствует режиму высокой активности, в связи с этим верхняя граница интервала 0О выбрана близко к 0. Нижняя граница интервала 0О выбрана так, чтобы в интервал попало не менее 50% наблюдений [21]. Выбранные границы интервалов приведены в табл. 8.
Табл. 8. Интервалы для классификации наблюдений
% (-ю, -100]
0О (-100, 10]
0В (10, +ю)
Для определения средних значений и стандартных отклонений режимов были сформированы 3 множества значений, принадлежащих расширенным на 50% интервалам [21], границы которых приведены в табл. 9.
Табл. 9. Расширенные интервалы
0Н + 50% (-ю, -50]
0О + 50% (-150, 15]
0В + 50% (5, +ю)
Далее были оценены среднее значение М[и^, дисперсия и
автоковариация со^и^,^) для каждого режима. На их основе получены значения параметров Е, О и В [21]. Полученные значения приведены в табл. 10.
Табл. 10. Оценки параметры режимов и параметры процесса и
М[и,] О В
0Н -106,03 1525,8 550,34 0,3607 -67,784 36,432
0о -40,556 1126,4 397,16 0,3526 -26,256 31,406
0В 143,53 15954 11561 0,7246 39,523 87,042
Для множеств значений, принадлежащих выбранным интервалам классификации наблюдений, были построены гистограммы с целью оценки вида распределения (рис. 26 - рис. 28).
Рис. 26 Гистограмма наблюдений числа выполненных команд в режиме вН
Рис. 27 Гистограмма наблюдений числа выполненных команд в режиме вО
Рис. 28 Гистограмма наблюдений числа выполненных команд в режиме вВ
Гистограмма наблюдений на рис. 27 содержит выброс около нулевого значения, что обусловлено спецификой подготовки данных: для выделения тренда использовался медианный фильтр. Исходные данные охватывали интервал в 11 недель, на вход фильтра подавалось 11 значений, в результате выбранное фильтром значение точно совпадает с 6-м значением. Как следствие, после вычитания тренда 1/11 значений будут являться нулями.
Выбор медианного фильтра был продиктован устойчивостью даваемой им оценки к появлению в исходных данных случайного выброса, который мог бы сильно исказить среднее значение.
В качестве случайных возмущений у1-, в процессе (8) был использован стандартный гауссовский белый шум. В результате получены следующие выражения для функций Р(х), в(х) и В(х) из (8):
(0,3607, -т <х < -100 Р(х) = { 0,3526, -100 < х < 10 ,
( 0,7246, 10 < х < +т
(-67,784, -т <х < -100 в(х) = {-26,256, -100 < х < 10 , ( 39,523, 10 < х < +т
(36,432, -т <х< -100 В(х) = { 31,406, -100 < х < 10 .
87,042, 10 < х < +т
Результаты моделирования приведены на рис. 29.
Рис. 29. Фрагмент смоделированных наблюдений процесса
Полученная модель обеспечивает значения статистических параметров (среднее значение и среднеквадратическое отклонение) для каждого режима активности и частоты изменения режимов активности вН, вО, вВ, близкие к параметрам наблюдений [21]. Хотя точность модели недостаточна, например, для задач прогнозирования, тем не менее ее можно применять для других задач, например, задач оценки характеристик программного обеспечения, либо исследования функционирования программного обеспечения под нагрузкой.
3.4. Выводы по главе
В главе рассмотрено использование моделей с порогами для задач моделирования базовых показателей функционирования Информационного web-портала - эффективности информационных источников и активности пользователей [21].
Предложенный подход к моделированию обладает тем преимуществом, что позволяет учесть характерные для нелинейных систем особенности, такие как зависимость возмущений от текущих значений показателя, цикличность процессов, скачкообразные изменения характеристик. Для учета таких явлений, с одной стороны, и для возможности использования в решениях полезных свойств линейных систем идентификации, с другой, и реализуется подход на основе
классификации возможных состояний изучаемого показателя. В области значений показателя выбираются интервалы. При нахождении значений показателя внутри интервала его динамика описывается простейшими линейными уравнениями. При выходе показателя за границы интервала модель меняется [5, 21].
Установлена возможность обоснованного выбора параметров рассматриваемых моделей за счет несложного статистического анализа среды функционирования портала [5, 21].
Описаны примеры применения процедур экспертного оценивания параметров на основе экспериментальных данных, собранных в процессе функционирования портала Российской академии наук www.ras.ru [21].
Полученные модели могут быть использованы при решении целого ряда практических вопросов, возникающих при разработке и внедрении таких web-систем, как Информационный web-портал: настройки параметров производительности, анализа работоспособности, оценки эффективности функционирования под нагрузкой и т.п. Традиционно, решение таких вопросов приходится выполнять в условиях реально функционирующей системы, поскольку в условиях стенда может быть достоверно смоделирована только конфигурация программных и аппаратных средств. В условиях стенда не составляет трудности смоделировать пользовательские запросы, однако характеристики потока запросов выбираются обычно произвольно и соотносятся с реальной нагрузкой весьма условно. Произвольные значения имеют и характеристики информационных источников при отсутствии реального информационного наполнения. При этом работа под реальной нагрузкой существенно усложняет как исследование работы web-системы, так и внесение изменений в ее работу, поскольку сопровождается снижением доступности системы для конечных пользователей. Применение же предложенных моделей позволяет в условиях стенда получить характеристики процессов пользовательской активности и функционирования информационных источников, близкие к наблюдаемым при работе системы с реальной нагрузкой. За счет изменения параметров соответствующих моделей становится возможным моделировать различные виды информационных источников и режимы пользовательской активности. Как результат, появляется возможность анализировать работоспособность и эффективность web-системы с различными
типами информационных источников и режимами пользовательской активности, при различных комбинациях настроек.
В частности, для получения оценок вероятностно-временных характеристик различных решений на основе Информационного web-портала, рассмотрению которых посвящена следующая глава, была разработана программа-имитатор [3, 4], со следующими возможностями:
- формирование потока событий в соответствии с предложенной моделью пользовательской активности и выполнения имитации действий пользователей для каждого такого события;
- использование программных интерфейсов автоматизации web-браузера для имитации действий пользователя (поскольку пользователями также используется web-браузер, взаимодействие с тестируемым ПО практически не отличается от работы с ним пользователей);
- имитация коллективной работы пользователей за счет запуска и управления несколькими экземплярами web-браузера;
- протоколирование результатов выполнения циклов имитации (тестируемая форма, значения набора входных данных, время выполнения запроса, результат выполнения запроса).
Перспективным представляется и создание имитатора информационного источника, характеристики эффективности которого будут определяться моделью эффективности для источника с реальным информационным наполнением.
4. Примеры внедрения
Рассмотренная в главе 2 система управления контентом была использована в составе портального решения в целом ряде разработок, выполненных ФИЦ ИУ РАН. На данное портальное решение, работы над которым были начаты еще в 2001 году, в 2005 году было получено свидетельство о регистрации программы [41], хотя практическое использование этого решения началось раньше. К настоящему моменту накоплен опыт внедрения данного портального решения в самых разных проектах. В данной главе будут рассмотрены проекты Информационного web-портала Российской академии наук и Учебного портала. Кроме того, полученные в главе 3 модели были применены к задаче оценивания вероятностно-временных характеристик программного обеспечения.
4.1. Информационный web-портал Российской академии наук
Проект Информационного web-портала Российской академии наук реализован в рамках целевой программы Президиума РАН «Информатизация научных учреждений и Президиума РАН» (с 2004 года программа «Информатизация»). Работа по проекту началась в 2001 году. Основные задачи программы изначально сформулированы в рамках создания Единой информационной системы Российской академии наук (ЕИС РАН) [28], затем в рамках проекта Единого научного информационного пространства РАН (ЕНИП РАН) [2].
ЕИС (ЕНИП) РАН - это интегрированное информационное пространство распределенных и локальных цифровых (электронных) ресурсов организаций РАН и комплекс программно-технических средств, обеспечивающий использование этих ресурсов и полнофункциональное управление ими [28]. Содержанием цифровых ресурсов является преимущественно научно-методическая и организационно-управленческая информация.
Первоначально проект академического портала предполагал его использование только в качестве официального представительства Российской академии наук в сети Интернет, однако в дальнейшем web-портал РАН стал рассматриваться как средство объединения множества научных информационных ресурсов и предоставления доступа к ним посредством унифицированного web-
интерфейса. Фактически, с помощью Информационного web-портала РАН была решена задача создания информационной среды поддержки научно-исследовательской деятельности и организационно-административных мероприятий.
В Концепции создания ЕИС РАН [28, 43] обозначены четыре комплекса задач подлежащих реализации в рамках системы. Выделим в этих комплексах задачи, реализуемые Информационным web-порталом РАН.
В рамках комплекса задач взаимодействия с внешними информационными системами Информационный web-портал РАН прежде всего, должен был обеспечить адекватное статусу Академии представление в сети Интернет. Кроме того, на портал возложены задачи интеграции и взаимодействия с ресурсами ЕИС (ЕНИП) РАН в академической инфраструктуре. Средства интеграции, реализуемые в рамках этой задачи, являются основным средством для включения существующих информационных ресурсов организаций РАН в единое информационное пространство. Помимо обеспечения доступа к ресурсам, портал выступает инструментом авторизации, защиты, соблюдения авторского права, автоматизации процессов интеграции и обеспечения открытости подключений к ресурсам. Задачи сопряжения с имеющимися государственными информационными системами, обеспечивающими существование научного сообщества, но не подчиненными непосредственно РАН, сформулированные в рамках данного комплекса целей, также отнесены к функциональности портала. Информационный web-портал РАН призван обеспечить расширение аудитории пользователей для владельцев интегрируемых цифровых ресурсов, повысить открытость и востребованность ресурсов за счет повышения их доступности, удобства в использовании, в поиске информации и в обеспечении взаимосвязи с другими ресурсами.
В рамках комплекса задач информационной поддержки научной и экспертно-аналитической деятельности научных учреждений и Президиума РАН портал РАН рассматривается как основное средство интеграции наследуемых информационных ресурсов.
В рамках комплекса задач информационного обеспечения организационно-управленческой деятельности научных учреждений и Президиума РАН
сформулированы задачи реализации информационных систем Президиума РАН, Отделений и Научных центров РАН. Данные системы должны были выступать компонентами ЕИС РАН, выступающими как в роли провайдеров, так и потребителей услуг Информационного web-портала РАН. Предполагалась разработка и внедрение общеакадемических информационных хранилищ по основным категориям организационно-административных данных (кадры, структура, мероприятия, награды и т.п.) как ресурсов Информационного web-портала РАН, Интернет-ресурсов Отделений и Научных центров РАН на основе использования хостинга услуг портала.
В рамках комплекса задач управления научной корпорацией портал РАН также рассматривался как базовое средство интеграции основных взаимосвязанных категорий научных цифровых ресурсов РАН, взаимодействия с имеющимися региональными и зарубежными информационными системами, с информационными системами РФФИ, Минпромнауки и Минобразования, органов государственной власти и управления, российских ВУЗов.
Система управления контентом, рассматриваемая в настоящей работе, создавалась специально для задач информационного web-портала. Виды контента, поддерживаемые системой, функциональные возможности по созданию и управлению контентом, средства интеграции выбирались и разрабатывались исходя из применения портала в рамках рассмотренных выше комплексов задач. На рисунках показаны пользовательские интерфейсы ряда административных подсистем: редактора структуры сайта (рис. 30), администратора хранилища статей [7] (рис. 31), администратора новостей (рис. 32).
Рис. 30
Редактор структуры сайта обеспечивает работу с логической структурой представления портала путем создания, модификации и удаления разделов и web-страниц. Также редактор обеспечивает назначение web-страницам шаблонов представления.
Рис. 31
Администратор хранилища статей предназначен для управления объектами, находящимися в хранилище портала. Администратор хранилища статей реализует следующие возможности:
- создание, модификацию и удаление статей в хранилище;
- перемещение объектов хранилища между папками;
- создание, модификацию и удаление папок в хранилище.
Рис. 32
Администратор новостей предназначен для управления публикацией новостей, дайджестов и объявлений в портале. Администратор новостей обеспечивает выполнение следующих функций:
- создание, модификацию и удаление новостей и объявлений;
- создание, модификацию и удаление новостных дайджестов;
- управление сроками публикации новостей;
- управление статусом новостей (опубликована / не опубликована / в архиве).
Основным средством ввода и модификации текстов статей, размещаемых в хранилище портала является HTML редактор (рис. 33). Редактор функционирует в web-браузере и обеспечивает возможности редактирования, близкие к возможностям Microsoft Word.
Редактор позволяет также модифицировать метаданные документа, такие как название, аннотацию, дату публикации, а также признак публикации документа. Данная информация используется при поиске документа и его размещении в хранилище портала.
Рис. 33
Помимо публикации контента через web-интерфейс, имеется ряд клиентских приложений, позволяющих публиковать контент в портале, например редактор электронных коллекций [34]. Редактор предназначен для создания интерактивных электронных книг (электронных коллекций) которые могут публиковаться как на носителях CD/DVD, так и в web.
Необходимость отображать информацию из большого числа разнообразных источников потребовало расширить возможности подсистемы представления в части использования динамических сценариев. Поскольку создание статичных форм отображения для каждого типа информации из каждого источника является трудоемким, имеется возможность формирования пользовательского интерфейса динамически, в соответствии со сценарием. Для сценариев создан специальный высокоуровневый язык, позволяющий обращаться к источникам и декларативно
описывать требуемое представление данных. Создание таких сценариев возможно вручную либо полуавтоматически в программном обеспечении администратора портала. Сценарии размещаются в тексте страницы и выполняются порталом при ее отображении. Динамическое создание пользовательского интерфейса используется также и для отображения поисковых форм.
4.2. Учебный портал
В 2008-2010 гг. на базе имеющихся решений по управлению контентом был создан проект учебного портала. В данном проекте на основе системы управления контентом построена система дистанционного обучения (СДО) - информационная система, предназначенная для организации учебного процесса в форме дистанционного обучения через сеть Интернет или Интранет.
СДО состоит из двух взаимодействующих систем: системы управления обучением (Learning Management System, LMS) и системы управления учебным контентом (Learning Content Management System, LCMS) [70].
LMS является средством организации учебного процесса, контроля знаний и решения различных административных задач, включая регистрацию обучаемых, назначение им конкретных курсов, сбор статистики обучения и т.п. Статистика обучения используется для формирования отчетов, отслеживания процесса обучения, анализа активности использования учебных курсов.
LCMS является средством для быстрого и эффективного создания учебного контента, т.е. учебных информационных ресурсов, из которых формируются курсы. Основными пользователями LCMS являются разработчики учебного контента. В то же время LCMS имеют также средства представления учебного контента и сбора статистики обучения, что объединяет их с LMS. Свойства обоих видов систем взаимно дополняют друг друга, поэтому совместное их использование расширяет возможности обучения и администрирования.
Функции СДО при ее использовании в организации и проведении обучения обеспечивают:
- автоматизацию процесса дистанционного обучения;
- равные возможности доступа слушателей (независимо от их территориальной удаленности) к ресурсам дистанционного обучения;
- обеспечение высоких стандартов и качества образования за счет реализации комплексных образовательных программ, основанных на отечественном и международном опыте образования, а также использовании передовых психолого-педагогических, информационных, коммуникационных и других технологий обучения;
- организацию процесса профессионального и дополнительного образования на основе тесного и непрерывного дистанционного взаимодействия слушателей и высококвалифицированных преподавателей, экспертов и консультантов;
- обеспечение полноценной оперативной (педагогической) и отсроченной (образовательной и социально-психологической) обратной связи со слушателями для определения эффективности процесса обучения.
Функционал СДО был реализован в виде программного модуля расширения и поддерживает работу с такими объектами, как учебные планы, учебные курсы и учебные модули. Все эти объекты с точки зрения CMS представляют собой новые типы контента. СДО поддерживает иерархическую организацию учебных курсов, при этом учебные планы играют роль шаблонов для курсов. Была реализована поддержка следующих типов учебных модулей:
- HTML документы;
- файлы электронных документов, разработанных с помощью прикладного программного обеспечения: документы MS Office (PowerPoint, Word, Excel и др.), MHT, PDF и т. п.;
- пакеты SCORM (Sharable Content Object Reference Model) [94];
- тесты в форматах IMS QTI 1.1 и 2.0 [75].
Учебные модули типа «HTML документ» и «Тест» могут быть созданы непосредственно в СДО, остальные типы модулей загружаются в систему средствами файлового хранилища либо через средства импорта. Для импорта модулей SCORM и IMS QTI был реализован загрузчик, поддерживающий спецификацию IMS Content Packaging [59]. На (рис. 34) приведен интерфейс обучающегося с выполняющимся модулем SCORM.
Рис. 34
Подсистема представления была адаптирована для работы со стандартными пакетами SCORM за счет реализации специального web-сервиса и клиентской части среды исполнения SCORM.
4.3. Оценивание вероятностно-временных характеристик программной системы на базе Информационного web-портала
В контексте задачи оценки надежности информационно-телекоммуникационных систем (ИТКС) приходится рассматривать набор разнообразных факторов: от характеристик различной аппаратуры до сбоев прикладных программ, приводящих к потерям данных. Как следствие, приходится привлекать разные методы для их количественного описания. В [3] была предложена простая методика, включающая в себя как традиционные приемы теории массового обслуживания применительно к аппаратному обеспечению ИТКС, так и базовые методы статистики, применяемые в отношении программного
обеспечения (ПО) в составе ИТКС. Данная методика для получения оценки показателей функционирования ПО использует статистический анализ данных, накапливаемых пользователями, эксплуатирующими ПО. На практике доступность этих данных ограничена этапом опытной эксплуатации [19]. Навыки тестирования ПО у будущих пользователей не сопоставимы с навыками профессиональных тестировщиков. Другой проблемой является сложность создания прецедентов пиковой нагрузки, поскольку пользователи, эксплуатирующие ПО, не мотивированы в дополнительной работе, связанной с тестированием нового ПО и имитацией высоконагруженного, напряженного режима.
Полученные в предыдущей главе модели могут быть с успехом применены для имитационного моделирования пользовательской активности. Это позволяет проводить сбор нужного объема статистических данных, используемых в дальнейшем при комплексной оценке надежности ИТКС [3]. Другим положительным свойством этого подхода является возможность количественного и качественного управления нагрузкой на различные компоненты ПО.
Таким образом, имитационное моделирование [24] предлагается использовать как средство тестирования, как средство объективного оценивания тактико-технических характеристик ПО, а также как инструмент сбора статистики для последующего оценивания надежностных характеристик ПО.
Далее описаны целевые показатели функционирования ПО, оценка которых выполняется в рамках предлагаемого подхода, модель компонента ПО, описание и требования к программе-имитатору пользовательской активности и рекомендации по формированию тестового набора данных. Модель пользовательской активности и предложения по выбору ее параметров приведены в разделе 3.3.
4.3.1. Целевые показатели функционирования
Предлагаемый подход основан на методологии, представленной в [3]. К составу количественных показателей, определяющих надежность программного обеспечения ИТКС, отнесены: Т - среднее время наработки ПО на отказ, 5 -среднее время восстановления ПО после отказа, И - коэффициент готовности ПО.
Эти показатели естественным образом определяются как среднее для случайных величин: т- времени безотказного функционирования ПО, а- времени
, т г1, если отказа ПО нет, тт _ г ,
очередной команды/запроса: / = ]„ „„ Именно, I = М[т ], 5 =
ш. если отказ ПО есть.
восстановления функционирования ПО и I - индикатора штатной обработки
'1, если отказа ПО нет, -0, если отказ ПО есть.
М[а ], И = М[/ ], где М[- ] - оператор математического ожидания.
Данные характеристики позволяют:
- сделать квалифицированный формальный вывод о степени соответствия ПО требованиям тактико-технического задания;
- определить нагрузочные пределы применимости тестируемого ПО.
Показатели Г, 5, Я, представляют собой моментные характеристики
случайных величин. Таким образом, ключевым является предположение о случайном характере действий пользователя, эксплуатирующего ПО. Эта идея не является новой, а лишь обосновывает возможность применения при решении данной прикладной задачи математического аппарата теории систем массового облуживания.
В [3] в качестве исходных данных для оценки всех перечисленных математических ожиданий предлагается взять статистику, формируемую пользователями. В процессе проведения опытно-конструкторских работ всегда запланирован этап опытной эксплуатации, на котором ведется журнал опытной эксплуатации. В этом журнале пользователь фиксирует все факты в отношении работы ПО, обеспечивая сбор статистики, по которой в дальнейшем вычисляются оценки количественных показателей.
4.3.2. Модель компонента программного обеспечения
Первым шагом в решении задачи имитации действий пользователей должно стать определение модели программы [33]. Предложить общую модель для этого, по-видимому, невозможно. Далее предлагается рассмотреть обобщенную трехуровневую архитектуру ПО. К ней может быть приведена и архитектура информационного web-портала, как основы информационной системы.
Первый уровень включает множество источников, содержащих интересующую пользователей информацию (баз данных, файлов, сторонних информационных систем). Второй уровень представляет собой выполняемый на центральном узле системы, сервере, программный модуль, который формирует пользовательский интерфейс и обеспечивает преобразование инициируемых
и и и и
пользователями действий в набор запросов в терминах некоей общей для всех информационных источников модели. Далее этот уровень переводит запросы в термины конкретных информационных источников, с учетом их программной реализации, выполняет запросы, получает и консолидирует ответы, и осуществляет обновление интерфейса пользователя с учетом этих ответов. Третий уровень представлен web-браузерами, через которые осуществляется коллективный доступ пользователей к центральному узлу программной системы, отображение пользовательского интерфейса и взаимодействие с ним.
Обобщенно функционирование такой системы сводится к выполнению следующей последовательности действий:
1) получение сервером запроса, сформированного в web-браузере пользователя;
2) передача запроса серверному приложению, которое, анализируя поступивший запрос, определяет перечень участвующих в его выполнении информационных источников;
3) выполнение запросов к информационным источникам с последующим накоплением и объединением результатов этих запросов;
4) формирование HTML-представления результатов обработки запросов и отправка сервером HTML-представления web-браузеру пользователя.
Для имитации работы пользователей с таким ПО необходимо подготовить описание входных данных, которое должно включать:
1) состав экранных форм, для которых выполняется имитация пользовательских запросов/команд;
2) состав элементов пользовательского интерфейса для каждой формы;
3) перечень типов данных, которые должны вводиться пользователями в элементы пользовательского интерфейса, обязательность наличия таких данных, граничные значения;
4) перечень словарных значений для каждого элемента пользовательского интерфейса, принимающего такие значения.
На основе этого описания, используя генераторы псевдослучайных последовательностей можно сформировать наборы входных данных для всех экранных форм, участвующих в имитации.
Работу пользователя с программной системой предполагается представить следующим простым сценарием:
1) открытие требуемой экранной формы;
2) заполнение элементов пользовательского интерфейса входными данными;
3) инициирование события пользовательского интерфейса, которое приведет к отправке запроса на центральный узел программной системы;
4) получение результатов.
Наличие у современных web-браузеров развитых программных интерфейсов позволяет автоматизировать эти действия. Алгоритм имитации действий пользователя должен включать следующие шаги:
1) открытие экранной формы;
2) заполнение элементов пользовательского интерфейса элементами набора входных данных;
3) программная генерация события пользовательского интерфейса, которое приведет к отправке запроса на центральный узел программной системы;
4) определение факта выполнения запроса центральным узлом с возможностью измерить время выполнения запроса и его результат.
Таким образом, циклически формируя очередной набор входных данных и выполняя алгоритм имитации действий пользователя, возможно имитировать работу с ПО в целом. При этом возможно получение сколь угодно высокого уровня нагрузки на программную систему и обеспечивающее ее функционирование оборудование, который не достигается при реальной повседневной работе пользователей. Еще одним достоинством метода является одинаковое «внимание» ко всем экранным формам ввода, в отличие от повседневных задач пользователей, когда часть форм используется редко или не используется вообще.
Сбор данных, необходимых для получения оценок производительности и надежности системы также может быть автоматизирован.
4.3.3. Программное обеспечение для имитационного моделирования
Программа-имитатор, как отмечалось выше, определяется принимаемой моделью анализируемого компонента ПО. Предложения, сделанные выше в этой
части, основывались на имеющемся опыте применения в ИТКС Информационного web-портала - разработанного авторами ПО [23] и исследований его функционирования [5]. В частности, для портала разработана программа-имитатор, выполняющая сценарии, определенные в предыдущем разделе, и обеспечивающая следующие возможности:
1) формирование потока событий в соответствии с предложенной моделью пользовательской активности и выполнения имитации действий пользователей для каждого такого события;
2) использование программных интерфейсов автоматизации web-браузера для имитации действий пользователя (поскольку пользователями также используется web-браузер, взаимодействие с тестируемым ПО практически не отличается от работы с ним пользователей);
3) имитация коллективной работы пользователей за счет запуска и управления несколькими экземплярами web-браузера;
4) протоколирование результатов выполнения циклов имитации (тестируемая форма, значения набора входных данных, время выполнения запроса, результат выполнения запроса).
Для настройки программы-имитатора на конкретное ПО используется описание в формате XML, содержащее перечень форм и их полей. Для каждой формы указываются URL, по которому доступна форма, идентификатор формы и вероятность выбора формы (значение от 0 до 1). Для каждого поля формы указываются идентификатор поля, формируемый тестируемым ПО, тип поля (например, текстовое поле, флажок, кнопка), вероятность заполнения поля (значение от 0 до 1) и идентификатор генератора случайных значений, предоставляющего значения для подстановки в поле ввода.
Чтобы в процессе имитации тестируемое ПО обеспечивало формирование пакетов запросов, содержание которых было бы приближено к реальной работе пользователей, предлагаются два подхода:
1) значения полей ввода формируются с использованием генераторов псевдослучайных последовательностей, но с рядом ограничений на диапазон принимаемых значений;
2) значения полей ввода формируются на основе протоколов работы реальных пользователей.
Первый подход реализован в программе-имитаторе. Для каждого поля ввода возможно задание собственного генератора псевдослучайных последовательностей. Значения, формируемые генератором, могут иметь следующие типы: строка, строка с шаблоном, число, диапазон дат. Генератор значений типа «строка» использует словарь значений, элементы которого выбираются на основе псевдослучайного значения. Генератор значений типа «строка с шаблоном» использует шаблон, который позволяет в указанной позиции строки сформировать букву русского или латинского алфавита или цифру. Генератор значений типа «число» формирует число в заданном диапазоне. Генератор значений типа «диапазон дат» формирует пару значений типа «дата», определяющих диапазон дат и лежащих в заданном диапазоне. Используя ограничения на диапазоны значений и задавая вероятности заполнения полей в соответствии с ожидаемой частотой их использования можно настраивать содержание формируемых запросов.
Второй подход предполагает детальное протоколирование реальных действий пользователей, формируемых ими при обучении работе с ПО, при
и __т-ч и
проведении опытной эксплуатации. В дальнейшем эти протоколы могут использоваться в качестве исходных данных при имитации работы пользователей. Этот вариант менее удобен, т.к., во-первых, предполагает участие пользователей в формировании наборов входных данных, а во-вторых, требует вмешательства в разрабатываемое ПО с целью внедрения механизмов протоколирования. Однако, в некоторых случаях можно отказаться от протоколирования собственно действий, заменив их протоколированием уже сформированных запросов, что уменьшает объем требуемых модификаций. В частности, такой подход был применен при исследовании функционирования Информационного web-портала: на основе реальных запросов пользователей формировались словари, используемые программой-имитатором.
4.4. Выводы по главе
Четвертая глава посвящена примерам практического использования системы управления контентом в составе разработанного в ФИЦ ИУ РАН портального решения.
Сложившийся опыт внедрения системы управления контентом проиллюстрирован на примерах проектов Информационного web-портала Российской академии наук и Учебного портала.
Показано, что созданный инструментарий управления контентом является достаточно универсальным и может использоваться как в интернет так и в интранет решениях для управления жизненным циклом структурированной, слабоструктурированной и неструктурированной информации. Выбранная архитектура позволяет добавлять новые типы контента и модифицировать уже существующие, эта возможность неоднократно использовалась в ходе эксплуатации информационного web-портала РАН.
Применение CMS в интеграционных решениях показало практическую полезность динамического формирования пользовательского интерфейса на основе декларативных описаний и возможность их автоматизированной генерации. Данный подход позволил снизить трудоемкость процесса интеграции источников.
Также следует отметить, что открытость системы позволила легко организовать сбор данных для исследования ее поведения, проведенного в главе 3.
Модели, полученные в результате этого исследования нашли практическое применение при решении задачи оценивания надежности программного обеспечения ИТКС. Опорной идеей предложенного метода является имитационное моделирование пользовательской активности.
Модель и программа-имитатор, ее реализующая, позволяют оценивать надежность ПО в составе ИТКС без привлечения к деятельному участию в этом пользователей, что и являлось основной задачей. При этом удалось добиться и других целей. Так, предложенная методика хорошо зарекомендовала себя как способ нагрузочного тестирования программ. В дальнейшем на ее основе планируется разработать комплексную информационную технологию оценки надежностных и временных характеристик ПО, а также выработки рекомендаций по численному составу эксплуатирующего персонала.
Заключение
В диссертационной работе представлены методы и технологии решения комплекса задач, возникающих при проектировании, реализации и тестировании систем управления контентом.
На защиту выносятся следующие результаты:
1) проектные решения по архитектуре и технической инфраструктуре портальной CMS, полученные с использованием методов объектно-ориентированного проектирования и анализа алгоритмов и программ;
2) программа для ЭВМ, представляющая собой реализацию системы управления контентом и предназначенная для использования в составе интеграционной платформы информационного web-портала;
3) математическая модель динамики показателя пользовательской активности, представленная стохастической динамической системой, использующей авторегрессию с порогом;
4) математическая модель динамики показателя эффективности информационного источника, представленная стохастической динамической системой наблюдений, использующей авторегрессию с порогом. Предложен подход к определению параметров модели на основе несложного статистического анализа среды функционирования web-портала;
5) предложены алгоритмические и программные решения для нагрузочного тестирования и анализа вероятностно-временных характеристик программной системы на основе интеграционной платформы Информационного web-портала.
Вместе с этим, исследования в направлении совершенствования программных архитектур систем управления контентом и повышения эффективности их функционирования не могут считаться завершенными. Имеющееся программное решение продолжает развиваться, создаются реализации для других проектов, функционал решения продолжает дополняться.
Предложенные в диссертации модели для ключевых процессов, функционирования информационного портала, должны быть усовершенствованы и уточнены, а экспертный метод выбора их параметров должен быть формализован.
Возможно использование этих моделей не только в составе инструментов нагрузочного тестирования, но и для решения задач оптимизации функционирования портала, например, в качестве встроенного инструментария, позволяющего оптимизировать работу самого информационного портала с информационными источниками.
Все указанные направления представляются весьма перспективными и требуют продолжения работы.
Список литературы
1. Бездушный А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек // Программирование. №4, 2000
2. Бездушный А.А., Бездушный А.Н., Серебряков В.А., Филиппов В.И. Интеграция метаданных Единого Научного Информационного Пространства РАН. Препринт // Вычислительный центр РАН, Москва, 2006.
3. Борисов А. В., Босов А. В., Иванов А.В., Корепанов Э. Р. К вопросу расчета надежности информационно-телекоммуникационных систем: учет характеристик программного обеспечения // Системы и средства информатики, 2018. Т. 28. № 1.
4. Борисов А. В., Босов А. В., Иванов А. В., Чавтараев Р. Б. Имитационное моделирование пользовательской активности для оценивания вероятностно-временных характеристик программного обеспечения // Системы и средства информатики, 2018. Т. 28. № 2.
5. Босов А.В. Моделирование и оптимизация процессов функционирования Информационного web-портала // Программирование, № 6, 2009.С.53-66.
6. Босов А.В., Иванов А.В. О реализации системы управления содержанием информационного Web-портала // Информационные технологии и вычислительные системы. №4. - М.: ИМВС РАН, 2004. С.85
7. Босов А. В., Иванов А. В. Программная инфраструктура информационного web-портала // Информатика и её применения, 2007. Т. 1. Вып. 2. С.50-64
8. Босов А.В., Иванов А.В. Технологии построения служб представления и персонализации Информационного Web-портала РАН // Интегрированная система информационных ресурсов. Архитектура, реализация, приложения. ВЦ им. А.А. Дородницына РАН. - М.: ВЦ РАН, 2004. С.216
9. Босов А.В., Иванов А.В. Технология управления содержанием в информационном портале РАН // Системы и средства информатики. Вып. 15. - М.: Наука, 2005. С.260-283.
10. Босов А.В., Иванов А.В., Полухин А.Н., Чавтараев Р.Б. Управление сайтом информационного web-портала // Системы и средства информатики. Вып. 15.
- М.: Наука, 2005, С.233-259.
11. Босов А. В., Полухин А. Н. Технология интеграции и доступа к данным в информационном web-портале // Системы и средства информатики. Вып. 16.
- М.: Наука, 2006, С.355-373.
12. Босов А.В., Полухин А.Н. О реализации сервиса аутентификации web-портала // Информационные технологии и вычислительные системы. - М.: ИМВС РАН, 2005.
13. Босов А.В., Серебряков В.А. Информационный веб-портал Российской академии наук // Материалы конференции «Государство в XXI веке», Москва, 10 апреля 2003г., Moscow, Renaissance Hotel,
https://web.archive.org/web/20030719032910/http://www.microsoft.com:80/rus/d ocs/events/materials/100403/IvanPa_Section_Portals/Bosov_MS_Conference_Apr il 2003.ppt
14. Босов А.В., Чавтараев Р.Б. Технология доступа к данным в Информационном web-портале // Информационные технологии и вычислительные системы. -М.: ИМВС РАН, 2007, №1, С.35-48.
15. Босов А.В., Чавтараев Р.Б. Управление информационными компонентами Web-портала РАН // Системы и средства информатики. Вып. 13. - М.: Наука, 2003. С.156-171.
16. Босов А.В., Чавтараев Р.Б. Организация поиска в Информационном web-портале // Системы и средства информатики. Специальный вып. «Научно-методологические проблемы информатики» - М.: Наука, 2006, С.438-460.
17. Буч Г., Максимчук Р., Энгл М., Янг Б., Коналлен Дж., Хьюстон К. Объектно-ориентированный анализ и проектирование с примерами приложений, 3-е изд. : Пер. с англ. - М.: ООО «И.Д.Вильямс», 2008, - 720 с.
18. Вандюк Д., Вестгейт М. CMS Drupal: Руководство по разработке системы управления сайтом. Пер. с англ. - М. : ООО «И.Д. Вильямс». 2008. - 400 с.
19. ГОСТ 34.601-90. Автоматизированные системы. Стадии создания. - М.: Стандартинформ, 2009. 5 с.
20. Жарикова Е. Выбор системы управления контентом интернет-ресурса // Инфобизнес-Онлайн, 14.10.2002
https://web.archive.org/web/20050217072722/http://www.ibusiness.ru/marcet/tele
/20905/
21. Иванов А.В. Математические модели базовых процессов функционирования информационного web-портала // Системы и средства информатики. Вып. 20. - М.: ТОРУС ПРЕСС, 2010. №1 С.106-132.
22. Иванов А.В., Савченко П.А. Система дистанционного обучения на основе технологий информационного web-портала // Методы построения и технологии функционирования ситуационных центров. - М.: ИПИ РАН, 2011. С. 221-238.
23. Иванов А.В., Чавтараев Р.Б., Полухин А.Н., Босов А.В., Балабанов К.В. Программа "Информационный Web-портал" // Свидетельство об официальной регистрации программы для ЭВМ №2005612992 от 20 сентября 2005 г.
24. Ивахненко А. Г., Юрачковский Ю. П. Моделирование сложных систем по экспериментальным данным. — М.: Радио и связь, 1987. 120 с.
25. Леонтьев И.В., Калиниченко Л.А., Максимов Н.В. Интеграция документальных ИПС в посреднике неоднородных коллекций данных электронных библиотек на примере ИПС Ирбис. // Сб. докладов 3-й Российской научной конференции «Цифровые библиотеки: Методы и технологии», 11-13 сентября 2001, Петрозаводск. http://rcdl.ru/doc/2001/leontyev_kalinichenko.pdf
26. Кибзун А.И., Панков А.Р., Сиротин А.Н. Учебное пособие по теории вероятностей // М.: Издательство МАИ, 1993
27. Косяков И. Классификация систем управления сайтами // 2002 https://web.archive.org/web/20050327005000/http://business-site.ru/project/wsms/classification_wsms.htm
28. Концепция создания Единой информационной системы РАН (вторая редакция) //
https://web.archive.org/web/20150315090831/HTTP://www.ras.ru/scientificactivit y/eis/eisconception.aspx.
29. Коули С. Конец рынка порталов // Computerworld, 2005. №32, https://www.osp.ru/cw/2005/32/130783/
30. Ларман К. Применение UML 2.0 и шаблонов проектирования. Практическое
руководство. 3-е издание. М. Пер. с англ. - М. : ООО «И.Д. Вильямс», 2009. - 736 с. : ил
31. Льюнг Л. Идентификация систем. Теория для пользователя // М.: Наука, 1991.
32. Мур К. Контент приближается к приложениям // Журнал «Сети», №8, 2001 г. Издательство «Открытые Системы» http://www.osp.ru/nets/2001/08/144766/
33. Неуймин Я. Г. Модели в науке и технике. История, теория, и практика. — Л.: Наука, 1984. 190 с.
34. Чавтараев Р.Б., Стефанович А.И. Применение средств WPF при реализации инструментария для создания и публикации электронных коллекций // Системы и средства информатики. Вып. 20, № 2 - М.: Наука, 2010, С.160-177
35. Порталы сегодня // Computerworld, 2004. №36. http://www.osp.ru/cw/2004/36/80739/.
36. Пугачев В.С., Синицын И.Н. Теория стохастических систем // М.: Логос, 1971.
37. Пугачев В.С., Синицын И.Н. Стохастические дифференциальные системы. Анализ и фильтрация // М.: Наука, 1985.
38. Рихтер Дж. Программирование на платформе Microsoft .NET Framework. Мастер класс. / Пер. с англ. - 3-е изд. - М.: Издательско-торговый дом «Русская редакция»; СПб.: Питер, 2005
39. Розенфельд Л., Морвиль П. Информационная архитектура в Интернете. (пер. с англ. Маккавеевой С.) Изд. 2-е Пер. с англ. - М. : Символ-Плюс . 2005. -544 с.
40. Нина Савельева. Системы управления контентом // Открытые системы. 04 2004. http : //www.osp.ru/os/2004/04/184166/
41. Свидетельство о регистрации программы для ЭВМ №2005612992 от 20 сентября 2005г.
42. Соколов И.А., Босов А.В., Бездушный А.Н. О Информационном Web-портале Российской академии наук // Системы и средства информатики. Вып. 13. - М.: Наука, 2003. С. 119-138.
43. Соколов И.А., Босов А.В., Зацман И.М., Иванов А.В., Чавтараев Р.Б. О концептуальных основах разработки Единой информационной системы РАН
// Системы и средства информатики. Вып. 12. - М.: Наука, 2002, С.29-47.
44. Хенриксон Х., Хоффман С. IIS 6.0. Полное руководство. Справочник профессионала. // Пер. с англ. - М.: Эком, 2004
45. Чавтараев Р.Б., Босов А.В. Ресурсы академического портала: личные архивы выдающихся ученых // Сборник тезисов постерных докладов 8-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL'2006, Суздаль, Россия, 2006, C.66-67.
46. Черняк Л. Корпоративный портал // 1999 http://www.pcweek.ru/idea/article/detail.php?ID=51690
47. Ширяев А.Н. Основы стохастической финансовой математики. Том 1. Факты. Модели // М.: ФАЗИС, 1998.
48. Advantages of push CMS // Hannon Hill Corporation, 2010 http://web.csulb.edU/committees/webcomm/hannonhill/Push_CMS_Advantages.p df
49. Andersson E., Greenspun P., Grumet A. Software Engineering for Internet Applications. // MIT Press 2006; ISBN 0262511916, http://philip.greenspun. com/seia
50. Bianco P., Kotermanski R., Merson P. Evaluating a Service-Oriented Architecture // Technical report, September 2007 http://www.sei.cmu.edu/reports/07tr015.pdf
51. Boiko B. Content Management Bible, 2nd Edition // Wiley Publishing, Inc., Indianapolis. 2005
52. Browning P., Lowndes M. JISC TechWatch Report: Content Management Systems //
https://www.webarchive.org.uk/wayback/archive/20130607130109/http://www.jis c.ac.uk/whatwedo/services/techwatch/reports/horizonscanning/hs0102 .aspx
53. Browning P., Lowndes M. Content Management Systems // JISC TechWatch Report, September 2001
https://www.webarchive.org.uk/wayback/archive/20130607130109/http://www.jis c.ac.uk/media/documents/techwatch/tsw_01-02.pdf
54. Tony Byrne. CM vs DM vs KM vs DAM vs SCM vs DRM - Which One is Right for You? // 17 Nov 2001
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
https://web.archive.org/web/20091024071528/http://www.cmswatch. com/Feature/ 53-%22IM%22-Soup
Cao J. et al. On the nonstationarity of internet traffic // Sigmetrics/Performance, ACM Press, 2001, P.102-112.
Cascading Style Sheets (CSS1) Level 1 Specification // http://www.w3.org/TR/CSS1/
CMS Review Feature List // http://www.cmsreview.com/Features/Lists.html Content Management Requirements Toolkit //
https://web.archive.org/web/20120322115118/http://www.steptwo.com.au/product s/toolkit
Content Packaging Specification //
http://www.imsglobal.org/content/packaging/index.html
Cummings D. Push Vs. Pull - The Battle for the Best CMS // 2005
http://www.sitepoint.com/push-pull-best-cms/
DITA Version 1.1 Architectural Specification // http://docs.oasis-
open.org/dita/v1.1/OS/langspec/ditaref-type.html
DITA Version 1.1 Language Specification // http://docs.oasis-
open.org/dita/v1.1/OS/archspec/archspec.html
DocBook Specifications // http://www.docbook.org/specs/
Documentum 5 Architecture: An In-Depth Technical Review // Documentum
Technical White Paper
http://www.usda.gov/egov/egov_redesign/intranet/edep/wp_tech_d5_arch_digest.p df
Doyle B. CMS Genesis: Who Did What When? // EContent Magazine, July 2004.
http://www.econtentmag.com/Articles/ArticleReader.aspx?ArticleID=6819
Doyle B. Seven stages of the CM Lifecycle // 2005
http://www.econtentmag.com/?ArticleID=13554
Dublin Core // http://www.dublincore.org/
Extensible Markup Language (XML) 1.0 (Third Edition) //
http://www.w3.org/TR/xml/
Gottlieb S. CMS Deployment Patterns // 2007
https://web.archive.org/web/20070629053059/http://contenthere.blogspot.com/200
70
71
72
73
74
75
76
77
78
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.