Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота тема диссертации и автореферата по ВАК РФ 05.25.05, кандидат наук Кортиков, Федор Сергеевич
- Специальность ВАК РФ05.25.05
- Количество страниц 107
Оглавление диссертации кандидат наук Кортиков, Федор Сергеевич
Оглавление
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Введение
Глава 1. Анализ существующих СЭД
1. Базовые понятия и терминология
1.2.1 Основные решаемые задачи
1.2.2 Факторы выбора
1.2.3 Проблемы при внедрении
1.3 Классификация СЭД
1.4 Анализ существующих систем электронного документооборота в России
1.5 Сопоставление функционала у существующих систем
1.6 Ранжирование
Глава 2. Интеграция данных распределенных гетерогенных информационных источников
2.1 Проблема интеграции данных. Существующие подходы
2.2 Механизмы отображения моделей данных
2.3 Открытая архитектура данных
2.4 Автоматизированное извлечение семантической разметки из электронного документа
2.5 Объединение семантически размеченных данных на основе
структурных моделей
Глава 3. Реализация комплекса программ с использованием структурной модели
3.1 Система документооборота на базе технологии SWEB
3.1.1 Дизайн
3.2 Архитектура
3.2.1 Мобильный модуль
3.3 Безопасность Web-cepbhcob
3.4 Использование технологии XML-DS
3.4.1 Формирование цифровой подписи
3.4.2 Проверка подлинности подписи
3.5 Технологии, использованные в программном комплексе
3.6 Встраивание компонента цифровой подписи в систему SWEB
3.7 Пример интеграции структурной модели в проекте SWEB
3.8 Оценка интероперабельности системы электронного документооборота
3.8.1 Параметры соответствия открытой архитектуре данных
3.8.2 Методика сравнительной оценки интероперабельности систем
3.9 Расчет критерия готовности СЭД с использования структурного
подхода методом сводного показателя
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ДОПОЛНЕНИЕ
Общая характеристика работы.
Актуальность проблемы. Разработка методов интеграции информационных ресурсов - одна из наиболее актуальных проблем в области информационных систем. Особенно большое внимание она стала привлекать в последние годы в виду высокой гетерогенности информационных источников данных. Наличие различного рода электронных документов делает систему электронного документооборота (СЭД) высоко гетерогенной информационной системой. При этом электронные документы не обеспечиваются семантическим описанием, что резко затрудняет целенаправленное извлечение знаний для идентификации в предметной области. В данной работе метаданные выделяются согласно специально разработанному словарю. Это должно повысить уровень производительности функционирования системы электронного документооборота, таким образом, работа является актуальной.
Степень разработанности темы. Проблема интеграции документ ориентированных баз и хранилищ данных не является новой. Первые шаги в этой области относятся еще к середине 70-х гг., когда начались разработки распределенных систем баз данных. Вопрос интеграции данных достаточно хорошо проработан для реляционных БД, однако для структурных моделей остается лишь слабо изученной областью исследований. По отдельным направлениям специалистами по проектированию информационных систем выдвигались методы и подходы к решению проблем достижения интероперабельности и интеграции баз и хранилищ данных. Из существующих, можно выделить работы Калиниченко Л.А., Колчанова H.A., Подколодного Н.Л., Когаловского М.Р. Данные работы имели узкоспециализированное значение и ориентировались на решение конкретных проблем.
Цель диссертационной работы - повысить производительность функционирования системы электронного документооборота в государственных учреждениях, а также на транспортных и производственных предприятиях.
Основные задачи исследования. Для достижения указанной цели диссертации решены следующие задачи, которые выносятся на защиту:
1. Провести анализ существующих систем электронного документооборота. Произвести классификацию существующих систем электронного документооборота. Определить основные принципы и требования к функционированию системы электронного документооборота.
2. Построить структурную модель предметной области. Разработать численные методы и соответствующие им алгоритмы, обеспечивающие количественную оценку интероперабельности структурной модели.
3. Вывести основные правила принятие решения о степени интероперабельности СЭД на основе ее совокупного взвешенного ранга.
4. Разработать программный комплекс по управлению бизнес-процессами, описанными с помощью предложенного формального языка. Разработать модель автоматического определения метаданных электронных документов.
5. Провести апробацию результатов диссертационной работы на процессе управления документопотоком на предприятии.
Научная новизна.
Разработана структурная модель системы электронного документооборота, отличающаяся от существующих систем тем, что включает семантический анализ документов с использованием математического аппарата.
Разработаны алгоритмы оценки степени обеспечения интероперабельности систем документооборота по количественным и качественным характеристикам. Разработаны критерии оценки степени достижения интероперабельности системы документооборота.
Сформулирован подход к автоматическому получению семантической разметки электронного документа, отличающийся меньшей алгоритмической сложностью.
Результаты работы соответствуют паспорту специальности 05.25.05 «Информационные системы и процессы»:
1. «Методы и модели описания, оценки, оптимизации информационных процессов и информационных ресурсов, а также средства анализа и выявления закономерностей в информационных потоках. Когнитивные модели информационных систем, ориентированных на человеко-машинное взаимодействие».
3. «Информационное обеспечение процессов и систем, в том числе новые принципы организации и структурирования данных, концептуального, логического, физического проектирования табличных, текстовых, графических и мультимедийных баз данных, документальных, фактографических и иных специализированных информационных систем. Методы оценки и оптимизации структур баз данных на логическом и физическом уровне».
7. «Прикладные автоматизированные информационные системы, ресурсы и технологии по областям применения (технические, экономические, гуманитарные сферы деятельности), форматам обрабатываемой, хранимой, представляемой информации (табличная, текстовая, графическая, документальная, фактографическая, первичная или вторичная). Аналитические, процедурные, информационные модели предметной области (системы принятия групповых решений, системы проектирования объектов и процессов, экспертные системы и др.), включаемые в контур обработки информации и принятия решений».
Теоретическая и практическая значимость работы подтверждается актом внедрения результатов диссертационного исследования Результаты
диссертационной работы с успехом использовались при проектировании и разработке системы электронного документооборота в ООО «БалтМорПроект».
А именно:
1. Повышению производительности поиска и навигации в электронных ресурсах;
2. Решение проблемы интеграции разнородных баз и хранилищ данных.
Методы и методологии исследования базируются на положениях современной теории систем и системного анализа, математической логике, а также на методах принятия решения в многокритериальной среде. В работе использованы методологии объектно-ориентированного программирования,
метапрограммирования, теории баз и хранилищ данных.
Положения, выносимые на защиту.
1. Структурированное описание множества объектов и понятий позволяющее сделать выборку ключевых свойств, влияющих на интероперабельность системы электронного документооборота.
2. Концепция автоматизированной технологии извлечения знаний из информационных ресурсов, не имеющих предварительного семантического описания.
3. Автоматическое извлечение семантической разметки из электронного документа. Составление структурной модели предметной области. Разбиение электронного документа, написанного на естественном языке человека на отдельные семантически размеченные фрагменты.
4. Интеграция данных гетерогенных источников на основе дескрипционной логики.
5. Система электронного документооборота на базе открытой архитектуры.
Все основные положения и результаты, выносимые на защиту, получены автором самостоятельно.
К объектам исследования относятся процессы документооборота производственных и транспортных предприятий, методы интеграции информационных систем, электронные документы, документопотоки, процессы движения и управления электронными документами, бизнес-процессы на предприятии.
Предметом исследования является автоматизация документооборота в государственных учреждениях, а так же на производственных и транспортных предприятиях.
Степень достоверности и апробация результатов.
Теоретические результаты, численные алгоритмы и реализующие их программы получены лично соискателем. Основные результаты работы докладывались соискателем на ежегодных научно-технических конференциях СПбГАСУ (2006-2013 гг.), на научно-технических конференциях СПИИРАН в 2011 - 2012 г., на международной конференции молодых ученых Ломоносов 2011, международной конференции IADIS Internet Technologies & Society 2011 (ITS 2011) Conference, Information Technology in Business 7nd Conference. Departament of Informatics St.Petersburg State University of Economics and finance.
Публикации. По теме диссертации опубликовано 8 научных работ. Результаты диссертации опубликованы в трех журналах из списка ВАК: «Вестник гражданских инженеров», «Информационно-управляющие системы», «Вестник Академии (Московская Академия Предпринимательства при Правительстве Москвы)».
Структура диссертации. Диссертация изложена на 107 страницах и состоит из введения, трех глав, заключения и дополнения. Список литературы содержит 138 наименований. Работа содержит 12 рисунков и 6 таблиц.
Рекомендованный список диссертаций по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК
Исследование и разработка методов и алгоритмов автоматизации документопотоков в корпоративных системах2003 год, кандидат технических наук Силантьева, Елена Юрьевна
Информационное обеспечение интеграции информационных систем на основе системы электронного документооборота2007 год, кандидат технических наук Завозкин, Сергей Юрьевич
Технология и методы управления документооборотом промышленных предприятий Социалистической Республики Вьетнам2008 год, кандидат технических наук Ле Кхак Нгок Ань
Модель и алгоритмы хранилища данных электронного архива технической документации и электронного документооборота научно-производственной организации2020 год, кандидат наук Черватюк Василий Демьянович
Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота2013 год, доктор технических наук Гудов, Александр Михайлович
Введение диссертации (часть автореферата) на тему «Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота»
Введение.
В любой из современных организаций в определенный момент встает вопрос о необходимости структурировать имеющуюся документацию, например, регистрировать входящую корреспонденцию, заявки, организовывать цифровые подписи в документах и т.п. Отсутствие таковой системы приведет к тому, что со временем возникают трудности: потеря важных документов, утечка конфиденциальной информации, документ не содержит требуемую подпись. Одним из методов, призванных обеспечить прозрачность и управляемость бизнес -процессами компании и поднять на уровень выше контроль их выполнения и реализации служит внедрение корпоративной информационной системы. По данным портала «DOC-ONLINE.RU» объем рынка систем электронного документооборота в денежном выражении в России в 2007 году составил более $ 170 млн.
Наиболее популярными на рынке информационных систем являются ЭОС, «Ланит», Directum и Cognitive Technologies, Upscale Soft, Docsvision, Alfresco и «CompanyMedia». Общее количество лицензий-мест проданных на территории стран CHF за 2011год составило~более 800 тысяч. За 2012 год прирост составил 300 тысяч лицензий.
По данным иностранных судоходных компаний, при заходе судна в порт представители проверяющих органов ставят на документы до 96 подписей. По официальным данным ОАО «Морской порт Санкт-Петербург» наблюдается стабильная динамика роста грузопотока с 2009 по 2012 года с преобладанием в темпе развития насыпных, навалочных и пищевых грузов. Система электронного документооборота делает работу порта более простой прозрачной - унифицирует процесс прохождения грузов, а именно дает возможность приступить к загрузке-разгрузке судна сразу же после его швартовки. Это сокращает время непроизводительных простоев флота, что выгодно как портовикам, так и
судовладельцу. Так, по опыту обработки судов-контейнеровозов в Одесском порту: экономия стояночного времени составляет до 25 суток в год, дополнительный доход порта - 6 млн долларов, судовладельца - не менее 2 млн долларов. Детализация по числовым показателям грузопотока приведена в Дополнении в (Таблице 5) и (Таблице 6).
Глава 1. Анализ существующих СЭД
Существуют различные системы электронного документооборота, и остается
только выбрать, какая же из систем, представленных в России, подходит именно этой организации. В первую очередь, конечно, важна экономическая эффективность использования электронного документооборота.
Эффективность = Результат/Затраты
Эффективность деятельности любой организации можно повысить двумя способами: сокращая затраты и увеличивая конечный результат.
Чтобы показать, насколько эффективно внедрение СЭД на предприятии, сделаем оценку эффективности. Оценим затраты на внедрение в 50 ООО рублей - при цене систем среднего ценового сегмента порядка 40 ООО и учете необходимости потратить некоторые ресурсы на обучение персонала - это достаточно пессимистичная оценка. Потери предприятия на ручном выполнении некоторых рутинных задач составляют до 30%. Предположим, у нас есть некоторое предприятие со штатом в 10 человек, средними потерями времени 20% и средним окладом в 20 000 рублей. Это означает, что уже за первый месяц работы установленной системы предприятие сэкономит примерно 40 000 рублей, что составляет 80% инвестиций в систему.
На снижение затрат влияют следующие факторы:
• сокращение затрат на бумажный документооборот (электронные документы дешево создавать, хранить и передавать);
• количественное уменьшение длительности операций, выполняемых сотрудниками;
• повышение производительности документопотока.
Для точной оценки экономического эффекта от внедрения системы нужно вычислить время, затрачиваемое на рутинные операции. По оценкам консалтинговых компаний это может быть 20-30% рабочего времени.
1. Базовые понятия и терминология.
Минимальная величина информации в СЭД - электронный документ. Основная задача в СЭД хранить электронные документы, вести их хронологическую запись изменений, обеспечивать документопотоки по предприятию, контроль над процессами, удовлетворяющими требованиям бизнеса, с которыми электронные документы имеют связь. С внедрением СЭД документ инкапсулирует в себя инструменты управления (и фактически сам становится оным) - все приказы, поручения, решения и прочие становятся потоком документов.
Существует два термина, которые часто путают: «делопроизводство» и «документооборот». Документооборот - это определение, используемое при оглашении специфичного набора действий при работе с метаданными документа. Существуют так называемые СЭД, которым можно задать все необходимые правила документопотока. Существуют системы, к которым изначально поставили цель - это поддержка различных правил. Такие системы не обладают всевозможными общими функциями, присущими другим системам, приближённо похожими к тому, чтобы они считались полностью автоматизированными СЭД. ГОСТ по документообороту и правил делопроизводства, который принят в России, довольно многоаспектен, и создание системы документооборота, удовлетворяющей всех положениям стандарта и правилам - задача не сложная и многокритериальная.
1.2.1 Основные решаемые задачи.
Системы документооборота в России, в частности на морском транспорте, внедряются, для того чтобы решить узкие задачи, которые поставлены перед высшим менеджментом и руководством предприятия. Ниже приведен список наиболее часто встречающихся задач [72].
■ Предоставление более эффективного управления посредством автоматизированного контроля исполнения, прозрачности всей компаниях в любых ее отделах.
■ Поддержка СКЧ, которое должно соответствовать международным стандартам.
■ Поддержка рационального накопления, управления и доступа к информации и знаниям. Наличие независимости от конкретного сотрудника с использованием профилирования всей истории своей деятельности за счет более формальной деятельности, как вместе, так и по отдельности каждого сотрудника.
■ Ход деятельности предприятия в целом (внутренние расследования офиса, анализ единиц, выявление «горячих точках» деятельности) оптимизации бизнес-процессов и автоматизация механизма их реализации и мониторинга.
■ Исключение бумажных документов из внутреннего оборота компании. Снижение затрат на кадры посредством сокращения издержек на контроль документационного обеспечения как бизнес-потока внутри организации.
■ Необходимо устранить все излишки при хранении документов, а так же снизить затраты на хранения бумажных образцов с использованием систем с так называемым электронным архивом.
1.2.2 Факторы выбора.
■ Требования в отношении хранения. Если у вас много документов (с точки зрения хранения), вы должны выбрать систему, которая поддерживает иерархическое структурированное хранение (ШМ - Архиерейская управление хранением). Такой механизм позволяет хранить в себе данные, к которым предоставляется наиболее быстрый доступ. Наиболее активные данные это не только самые быстрые данные, но и самые дорогие в средствах хранения информации. В то время, наименее часто используемые данные автоматически передаются в медленных и дешевых средствах коммуникации.
■ Присутствие заранее установленных правил, требующих сопровождения данного артефакта или типа и выполнение автоматизированного контроля. В частности сюда можно отнести подготовку отчета заданного образца, выполнение базовых проверок в организации.
■ Присутствие в автоматическом управлении документопотоком с организацией. Степень сложности организационной структуры.
■ Присутствие удаленных офисов и подразделений. В данном подходе требуется применять более сложные концепции по организации репликации данных.
■ Архивы высокой емкости. СЭД могут поставляться с уже интегрированными форм-факторами с высокой емкостью. Подсистемы ставятся уже с много приводными дисками и собственной операционной системой.
■ Присутствие не удовлетворяющей текущим потребностям системы документооборота.
• Требование в совершенствовании в управлении ходом документов а так же в управлении жизненным циклом документа и процессом его контроля. В ответ на эту необходимость, выдвигается предложение контроля произвольных бизнес-процессов.
■ Требования срока хранения. При длительных сроках хранения, значительно длительный период измеряемый не одним десятилетием, возникает вопрос репликации синхронного подмена дубликатов и поддержка оборудования.
■ Требования масштабируемости с точки зрения совместимости, расширяемость системы. Возможность интеграции с существующими информационными системами и использования существующего оборудования. Необходимость хранить изображения документов. Использование организации определенных форматов хранения документов.
■ Необходимость поддержки инженерных и конструкторских задач, других особенностей компании. Необходимость развитых средств поиска информации. Полная поддержка языка системы документов организации.
■ Требования безопасности (шифрование, обеспечение доступа и т.д.). Возможность использования существующей инфраструктуры организации и информационных механизмов доступа в системе документооборота. Требования на соответствие определенным стандартам: внутренним, промышленности, ГОСТ, международные стандарты контроля качества, уровню организации хранения информации.
1.2.3 Проблемы при внедрении.
■ Консерватизм плохо обучаемого персонала, низкий уровень образования (интеллекта), нежелание проходить подготовку и переподготовку. Боязнь прозрачности будет руководствоваться в своей деятельности. Все эти фобии порождаются внедрением СЭД.
■ Сотрудник под зачастую не хочет непосредственно работать с электронным документом, читать и править его.
■ Регулярные изменения в составе организации, нечеткое определение процессов протекающих внутри компании.
■ Требование иметь дубликаты не оцифрованных документов, особенно если это касается параллельных структур в исполнительных органах государственной власти, организациях или отделах, которые постоянно имеют взаимосвязную деятельность.
1.3 Классификация СЭД.
Во введении уже была приведена классификация в краткой форме.
Рассмотрим немного подробнее. На сегодняшний день аналитики ШС различают на
рынке следующие типы СЭД (Таблица 1):
Таблица 1. Классификация СЭД.
Тип Значение
Ориентированные на бизнес-процессы (business-process EDM) • использование для специфических приложений; • выполняют полный жизненный цикл работы с документами (включая работу с оригиналами, управление записями и потоками работ, управление контентом).
Корпоративные СЭД (enterprise-centric EDM) • обеспечение корпоративной инфраструктуры (доступ всем корпоративным пользователям) для создания документов, совместной работы над ними и их применения; • не является направленным на применение только в какой-то конкретной отрасли или на решение узкой задачи; • внедряются, как общекорпоративные системы.
Системы управления содержимым (content management systems) • создание, доступ и управление контентом; • доставку содержимого (вплоть до уровня разделов документов и объектов для их последующего повторного использования и компиляции); • инкрементный подход к доступу к информации обеспечивает более продуктивный процесс доступа к данным.
Системы управления информацией (Information Management Systems) • аккумулирование; • CMS решение; • доставку через существующий протокол передачи данных; • возможность самообучения посредством накопления опыта в распределенной корпоративной системе на основе использования бизнес-логик, ограничений и метаданных; • обеспечения доступа через стандартный Web-интерфейс к ряду приложений электронной коммерции (обычно, программное обеспечение как услуга).
Системы управления изображениями/образами (Imaging Systems) • оцифровка бумажных документов; « сканирование, хранение, обработка изображений.
Решения в области управления потоками работ на предприятии • обеспечение навигации потоков работ любого типа (определения путей маршрутизации файлов) в рамках корпоративных структурированных и неструктурированных бизнес-процессов; • использование для повышения производительности и степени контролируемости корпоративных бизнес-процессов; • обычно приобретаются как плагин или
18
расширение (например, EDMS-системы или
PDM-системы).
Данная выше классификации системы документооборота может быть дополнена еще системой управления корпоративными электронными документами. Часть рынка программного обеспечения для управления корпоративными записями на протяжении почти 12 лет претерпевала множество изменений. Изначально корпоративные записи фиксировались во времени и после были неизменны. Они свидетельствуют об операциях с различными правами и обязанностями, и других корпоративных пользователей, чтобы определить, какое содержание должно быть сделано в корпоративной записи (такое решение требует оценки будущих потребностей бизнеса). Среди корпоративных решений, требующих сохранение контента включают основных бизнес-систем, включая ERP-системы и системы бухгалтерского учета, системы электронной почты (например, Exchange), управления отчетов и вывода, электронная коммерция, программное обеспечение совместной работы (системы управления проектами, проведение онлайн-конференций и др.). Пример системы управления - это продукт TrueArc.
Многие важные функции Recordings control в системах документооборота не существуют (например, classification). Не были реализованы физические методы удаления записей и индексов в конце их жизненного цикла (при необходимости). По данным Gartner Group[37], корпоративным пользователям необходимо дополнить свои Web-сайты функцией системы управления записями. Ряд разработчиков систем управления Web-содержимым записей для поддержки Web-сайтов уже расширили их функциональность с помощью записей систем управления. Работы в этом направлении были особенно заметны в 2008-2010 годах, например, компания интегрировала программное обеспечение Stellent content management-система управления записями, в первую очередь, совместно с компанией TrueArc (следует отметить, что интеграция records management software EDS - очень просто и
элегантно решает проблему дублирования функций и хранилищ). После этой интеграции стало возможным делать "моментальные снимки", Web-сайт и управлять им в виде записи. Можно отметить и интересные функции, такие как скриншоты экранов, выполненные в ходе on-line транзакций (например, в программное обеспечение от компании WebCapture Tower Technology).
Многие корпоративные пользователи хотят иметь сбор данных из различных приложений, работающих в гетерогенных средах, а также генерировать отчеты в электронном виде. Эта возможность особенно полезна для компаний, использующих ERP-системы (которая есть и всегда будет хранить много информации, но не всегда гибко формировать все необходимые отчеты).
Гетерогенная среда сегодня представляют большой интерес. Этот термин относится не только к различному программному и аппаратному обеспечению в пределах одной организации, а также взаимодействию между различными субъектами. Как известно, проблема переписки между организациями, использующими различные системы электронного документооборота (DMS) может быть решена даже совершенно абсурдным способом - для примера, цифровой документ, созданный в одной организации, печатаются на бумаге, доставляется курьером или по почте в другую организацию, где он проверяется, и опять заносится в СЭД. Учитывая, что не все документы являются статичными, многие из них могут быть изменены, соответственно, количество документов в течение их жизненного цикла, подвергшихся редактированию, возрастает в несколько раз.
Интерес в интеграции гетерогенных систем привел к появлению так называемых систем управления (ERM, EDM), основной целью которых является генерация выходных документов. Некоторые дополнительные функциональные возможности для длительного хранения и архивирования вывода отчетов и документов. В связи с этим многие OMS-системы классифицируются Gartner Group, как комплексной системы архивации и поиска документов (IDARS -
интегрированный архив документов и поисковых систем). Главная причина популярности OMS-систем в том, что они по-прежнему занимают рыночную нишу -создание документов и отчетов в информационных системах предприятий и организаций, созданных с использованием ERP-систем.
1.4 Анализ существующих систем электронного документооборота в России.
В обзоре выделены 9 популярных отечественных систем электронного документооборота: Директум, Глобус профессионал, Пэйдокс, 1С:Документооборот и Босс-референт, ДЕЛО, ЕВФРАТ, Motive, ДоксВижн. В данной работе агрегирована информация собранная по фоициальным информационным страницам [1,2,4]: информационные материалы и демонстрационные версии программных продуктов. Представленный взгляд на СЭД — попытка оценить возможности и готовность программных продуктов решать актуальные задачи организации электронного документооборота на предприятии.
Критерии, выделенные в обзоре, помогут вам проанализировать возможности рассматриваемых решений с точки зрения технической реализации тех или иных задач СЭД. Все возможности разбиты на семь функциональных контуров:
• сохранение входной корреспонденции;
• работа с оцифрованными документами;
• управление потоками работ (Workflow) и контроль хода выполнения работ;
• интеллектуальный поиск информации;
• информационная безопасность;
• поддержка дублирующего, или отдельного бумажного документооборота;
• средства надстройки.
В обзоре имеется множество интуитивно понятных критериев, присущих всем описываемым СЭД и критерии, которые могут позволить найти необходимую разницу между системами. По большому счету, функциональные характеристики
систем совпадают, но только с помощью подробной детализация выделенных особенных задач в СЭД и особенности их создания позволяют сделать попарное сравнение всевозможных СЭД. Важно, что по вышеприведенным системам наблюдается достаточно обширный опыт внедрений. Все эти СЭД дают возможность множеству предприятий автоматизировать документопоток. Важно отметить, что не отечественном рынке присутствует почти 90 систем электронного документооборота.
При детальном анализе популярных СЭД, являющиеся победителями на рынке, выделено, что последние 5 лет их развитие было нацелено на улучшение сервисов и драйверов, почти все СЭД имеют одни и те же базовые возможности. Новейшие технологические аспекты порождают потенциал развития документооборота для целостного управления всевозможного вида содержимого (Multimodal Media), применение средств обработки и анализа семантики документа. Последняя функциональности в отечественном рынке плохо проработана и готовых общных решений не выделяется.
1.5 Сопоставление функционала у существующих систем.
Для сопоставления спецификаций у систем (Таблица 4) использованы нижеприведенные обозначения:
• спецификация уже есть - 2;
• необходимо что то докупить или доплатить - 1;
• спецификации не существует - 0.
Все эти системы узкоспециализированные - некоординированная попытка многих участников создать СЭД для узкого набора задач в скором будущем приведет к большим трудностям при взаимодействии этих не универсальных систем. Это делает более выгодным использование системы SWEB. В России она не используется, зато в Германии широко применяется в сфере электронного
правительства. Одними из приоритетов Б^ЕВ является интероперабельность и безопасность.
1.6 Ранжирование.
При принятии решений и прогнозировании вероятных исходов, как правило, сталкиваются со сложной организацией зависящих друг от друга, критериев, которые нужно упорядочить[33]. Сегодня доступно большое количество инструментов, позволяющих максимально облегчить выполнение задачи упорядочивания информации и помочь в решении проблем, связанных с процедурой альтернативного выбора. «Метод анализа иерархий», который разработан Т. Саати [33], на сегодняшний день используют повсеместно. Данный подход весьма полезен при оценке объектов недвижимости, морских судов, при оценке состояния причалов. Например, когда стоит задача в выборе наиболее подходящего причала для судна из множества существующих. Этот подход дает возможность группе экспертов сотрудничать при каком либо выборе. В дальнейшем, возможно, прийти к консенсусу. В итоге групповые мнения объединяются в главный критерий: при попарном сопоставлений характеристик документооборота по отношению к некоторой спецификации.
Существует классический подход системах принятия решений, который был разработан математиком Т. Саати. Такой подход успешно использовался в диссертационной работе ввиду того, что системы электронного документооборота это многокритериальные системы, где приходится оперировать с нечисловой и нечеткой информацией для того что провести взвешенную оценку. Осуществляется он следующим образом:
1) «структурирование проблемы выбора в виде иерархии или сети»[33];
2) «установка приоритетов критериев и оценка каждой из альтернатив по критериям» [33];
3) «вычисляются коэффициенты важности для элементов каждого уровня. При этом проверяется согласованность суждений»[33];
4) «подсчитывается комбинированный весовой коэффициент и определяется наилучшая альтернатива»[33];
В методе анализа иерархий Т. Саати наиболее важным моментом можно считать оценку верхних узлов графа, базируясь на взаимодействия разных уровней графа, а не из прямой зависимости от элементов на этих уровнях.
В результате детального анализа функционала, используемого для разработки той или иной системы документооборота, выделены 86 основных критериев
{ц}, (/ -1,2,...,и) ддя оценки СЭД. Проведено ранжирование каждой системы документооборота по каждому из критериев. Задача ранжирования решалась экспертным методом по Т.Саати.
Пусть, - множество нечисловых характеристик системы электронного
документооборота. Экспертные оценки о двух характеристиках определены
массивом -12,...,п) ^ Ячейки массива а" вычисляются следующим
образом.
1.Если °"=\то а,'=х1\ Ъ*0.
2. Если свойства и одинаково важны, то а" ~ 1, 0,1 ~1; в частности, а" ~1 для всех I.
Таким образом, матрица А имеет вид:
А
1/о12 1 ... а2п У<*и Уа2п... 1
от-/) И а = 3
3. Если ' немного важнее 7,то 4
4. Если превосходительно важнее , то а" ~5,
5. Если значительно важнее , то ~1.
6. Если ^ намного важнее'0', то а,< ~9.
7. Величины а" ~2'4'6'8 и их обратные значения введены для нахождения альтернатив для оценочных данных имеющих небольшую разницу.
Представим количественные суждения о парах (А> А) в переформулированном
выражении, используя . Массиву значений А>А>--->А сопоставим в соответствие массив числовых характеристик значимости. Они будут соответствовать высказанным суждениям о парных сравнениях. Для этого вычислим вектор приоритетов по матрице (А) - «вычисление главного собственного вектора, который после нормализации становится вектором приоритетов»[33]. Существует несколько подходов для оценки вектора приоритетов. Все они обладают различной точностью оценок.
Первый подход. «Для матрицы характеристик документооборота вычислить суммы элементов каждой характеристики и нормализовать делением каждой суммы на сумму всех характеристик. Полученный результат равен 1. Результирующей матрицей будет вектор с приоритетами для каждой системы»[33].
Второй подход. «Суммировать характеристики каждого документооборота и получить реверсные величины сумм, провести нормализацию да причем именно так, чтобы их сумма равнялась единице, разделить каждую обратное значение на сумму остальных обратных значений»[33].
Третий подход. «Деление элементов каждого столбца на сумму элементов этого столбца» (т.е. нормализация всех СЭД), «затем сложить элементы каждой полученной строки и разделить эту сумму на число характеристик строки. Это -процесс усреднения по нормализованным столбцам»[33].
Четвертый подход. «Умножить п элементов каждой строки и извлечь корень п-й степени. Нормализовать полученные числа»[33].
Все четыре подхода обеспечивают одинаковые векторы приоритетов, если матрица согласована. Требование к согласованности нашей матрицы выглядит
следующим образом:
л п
Лтах - п} Где шах _ максимальное собственное значение матрицы характеристик. Отклонение от согласованности определяется индексом согласованности
п-\
ИС =
Средние случайные индексы для массивов А размерности от 1 до 86, случайными выборками в программном продукте Excel.
Отношение индекса согласованности к среднему случайному индексу для массива той же размерности, в нашем случае это от 1 до 86 называется отношением согласованности (ОС). Величина отношения согласованности меньшее или равное 0,10 считается удовлетворительным. В работе будет проводится суммирование всех матриц по каждому эксперту. Количество экспертов участвующих в анализе систем не менее 9 человек.
Получены результаты ранжирования свойств продукта, полученные: вторым подходом парных сравнений по шкале Т. Саати.
я =9586 = =о,]\ б
Показатели согласованности матрицы: тах ' ; 1 ;
ИС
_1 л Q. ОС — — 0,08 z^)/^1 ^ п 1
- си .< 5 ЧТ0 свидетельствует о хорошей согласованности.
Информация о парных сравнениях, получаемая от экспертов по 9-ти бальной шкале Т. Саати, несет сведения крайне полезные при анализе ключевых характеристик системы электронного документооборота. На основе ранжирования сделана выборка ключевых свойств, влияющих на интероперабельность системы электронного документооборота. Показано, что самые значимые группы свойств характеризуют семантическое описание электронных документов.
Похожие диссертационные работы по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК
Разработка методов и алгоритмов безбумажного документооборота электронных архивов технической документации САПР2008 год, кандидат технических наук Малинин, Алексей Анатольевич
Оптимизация электронного документооборота в корпоративных системах2001 год, кандидат экономических наук Бессонов, Сергей Вячеславович
Методология защиты смешанного документооборота на основе многофакторной биометрической аутентификации с применением нейросетевых алгоритмов2019 год, доктор наук Ложников Павел Сергеевич
Разработка моделей и методов взаимодействия интернет-ориентированных систем управления документооборотом со средствами аутентификации2011 год, кандидат технических наук Клименко, Светлана Глебовна
Интеллектуальные методы организации архивов технической документации научно-производственного объединения2012 год, кандидат технических наук Радионова, Юлия Александровна
Список литературы диссертационного исследования кандидат наук Кортиков, Федор Сергеевич, 2013 год
ЛИТЕРАТУРА.
1. Андреев A.M., Березкин Д.В., Рымарь B.C., Симаков К.В. Использование технологии Semantic Web в системе поиска несоответствий в текстах документов. //URL: http://wvAv.inteltec.ru/publish/articles/textan/rimar_RCN32006. shtml
2. Бездушный А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек. Программирование, 2000, 4, с. 3-14.
3. Бискулова A.C. «Галактика Zoom» - уникальная система поиска и аналитических исследований текстовой информации в Интернете / A.C. Бискулова, A.B. Антонов, П.В. Щедрый // Сборник тру-дов Восьмой Международной конференции «Интеллектуальный анализ информации». - К., 2008. - С. 93-102.
4. Гаврилова Т.А. Онтологический инжиниринг [Электронный ресурс] / Т. А. Гаврилова. -Режим доступа : http://www.big. spb.ru/publications/bigspb/km/ontolog_engeneering.shtml
5. Гладун А.Я., Рогушина Ю.В. Структурной модели в корпоративных системах, Часть II // Корпоративные системы №1 / 2006 //URL: http://www.inanagement.com.ua/ims/imsl 16.html
6. ГОСТ Р 34.10-2001 Информационная технология. Криптографическая защита информации. Процессы формирования и проверки электронной цифровой подписи
7. Добров Б.В., Лукашевич Н.В. Вторичное использование лингвистических структурных моделей: изменение в структуре концептуализации. //URL: http://www.rcN32006.uniyar.ac.ru/papers/paper_78_vl .pdf
8. Добров Б.В., Лукашевич Н.В. Лингвистическая структурная модель по естественным наукам и технологиям для приложений в сфере информационного поиска. //URL: http://fccl.ksu.ru/issue_spec/docs/oent-kgu.doc
9. Дубова Н. DB4Web - шлюз между Web и базами данных. Открытые системы. 7-8. 1999. -С. 51-55.
10. Загоруйко Н.Г. и др. Система "Ontogrid" для построения структурных моделей //Компьютерная лингвистика и интеллектуальные технологии. Тр. междунар. конференции Диалог'2005 . М., 2005. С. 146-152.
11. Ефремов B.C., Ханыков И.А. Ключевая компетенция организации как объект стратегического анализа// Менеджмент в России и за рубежом, 2. 2002
12. Калиниченко JI.А. Метод построения коммутативных отображений моделей данных при интеграции неоднородных баз данных. Программирование, 6, 1978.
13. Калиниченко Л.А. Методы и средства интеграции неоднородных баз данных. -М.: Наука. Гл. ред. физ.-мат. литературы, 1983. - 424 с.
14. Калиниченко Л.А., Колчанов H.A., Подколодный Н.Л. Проблемы создания предметного посредника для интеграции молекулярно-генетических информационных ресурсов. Вторая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», Протвино, 2000, с. 174-184.
15. Калиниченко Л.А., Рамъялг А.Е. Логика отображения сетевой модели данных в реляционную. Программирование, 2, 1979.
16. Калиниченко Л.А., Рывкин В.М., Чабан И.А. Принципы организации и архитектура СИЗИФ - системы организации интегрированных баз данных. Программирование, 4, 1975.
17. Коваль С.А. Автоматическая переработка текста на базе объектно-предикатной системы // Структурная и прикладная лингвистика. Вып. 5. СПб., 1998. С. 199-207.
18. Коваль С.А. Безэкземплярные и экземплярные структурной модели. Материалы XXXVI Междунар. филолог, конф. 12 марта 2007 г. в Санкт-Петербургском университете (в печати). См. также материалы к докладу на URL: http://skowal.narod.ru/research/ontology2007
19. Когаловский М.Р. Архитектура механизмов отображения данных в многоуровневых СУБД.сб. «Техника реализации многоуровневых систем управления базами данных». -ЦЭМИ АН СССР, 1982. -С. 3-19.
20. Когаловский М.Р. Перспективные технологии информационных систем. - М.: ДМК Пресс, 2003.-288 с.
21. Кортиков Ф.С. Методика сравнительной оценки интероперабельности систем электронного документооборота в строительной организации /Кортиков Ф.С.// Москва. Издательство: «Вестник Академии (Московская Академия Предпринимательства при Правительстве Москвы)». №4-2011.-С. 125 -129;
22. Ладыженский Г.М. Шлюзы как средство интеграции баз данных. Открытые системы, 2, 1999.
23. Макаров И.М., Виноградская Т.М., Рубчинский A.A., Соколов В.Б. Теория выбора и принятия решений. М: Наука. 1982, 328 с.
24. Митрофанова O.A. Измерение семантических расстояний как проблема прикладной лингвистики // Структурная и прикладная лингвистика. Межвузовский сборник. Выпуск 7. Издательство СПбГУ, 2008.
25. Михаленко П. Язык структурных моделей в Web. //URL: http://www.osp.ru/os/2004/02/183921/
26. Мудрая O.B., Бабич Б.В. , Пьяо С.С. , Рейсон П. , Уилсон Э. Разработка инструментария для семантической разметки текст // Труды международной конференции "Корпусная лингвистика-2006". Издательства СПбГУ и РХГА, 2006.
27. Нариньяни A.C. ТЕОН-2: от Тезауруса к Структурной модели и обратно / A.C. Нариньяни // Труды Международного семинара «Компьютерная лингвистика и интеллектуальные технологии». - М. : Наука, 2002.-Т. 1.-С. 199-154.
28. Невзорова O.A. Онтологическая поддержка методов решения задач семантико-синтаксического анализа текстов [Электронный ресурс] / O.A. Невзорова. - Режим доступа : http://www.raai.org/cai-08/files/cai-08_paper_ 234.doc
29. Осипов М.А., Мачульский О.Л., Калиниченко Л.А. Отображение модели данных XML в объектную модель языка СИНТЕЗ. Программирование, 4, 2000, с. 23-30.
30. Палагин A.B. К проектированию онтологоуправляемой информационной системы с обработкой естественно-языковых объектов /A.B. Палагин, Н.Г. Петренко // Математические машины и системы. - 2008. - № 2. - С. 14-23.
31-. Проект Protege http://stanford.edu
32. Проект Semantic Web http://www.w3с.оrg/sw
33. Пфанцагль И. Теория измерений. М: Мир, 1976, 248 с.
34. Саати Т. Принятие решений. Метод анализа иерархий. М: Радио и связь. 1993, 320 с.
35. Спецификация языка RDFS http://www.w3c.org/rdfs
36. Стариковская H.A. Петров, А.Б. Методика сравнительной оценки интероперабельности информационных систем М: Информационные технологии и вычислительные системы. 2009, 82 - 90 с
37. Стоунбрекер М. И др. Системы баз данных третьего поколения: Манифест //СУБД. - 1995. -№2. -С. 143-158.
38. Тихомиров Ю.А. Теория компетенций. М: ЮРИНФОРМНЕТ. 2005 , 355 с
39. Филиппов В.И. Реляционно-сетевая модель данных. Прикладная информатика. Вып. 2. - М.: Финансы и статистика, 1983. -С. 147-170.
40. Хаав Х.-М.Х. Единый язык описания моделей данных. Прикладная информатика. Вып. 2. -М.: Финансы и статистика, 1986. -С. 130-142.
41. Ханыков И.А. Стратегическое планирование на основе исследования ключевых компетенций организаций в бизнес-системе. М: ТРААЛЬ. 2003, 176 с
42. Хованов Н. В., Федотов Ю. В. Модели учета неопределенности при построении сводных показателей эффективности деятельности сложных производственных систем. Научные доклады №28, 2006 - СПбГУ
43. Эйзенберг Э., Мелтон Дж. SQL: 1999, ранее известный как SQL3. Пер. с англ. Открытые системы. - 1999. -№ 1. -С. 52-57.
44. Armstrong J. Programming Erlang: Software for a Concurrent World. P ragmatic Bookshelf. 2007.
45. Eckel B. Thinking in Java (4th Edition). NJ: Prentice Hall PTR, 2005.
46. Frequent Itemset Mining Dataset Repository [Электронный ресурс]. - 2000. - Режим доступа : http:// fimi.cs.helsinki.fi/data/
47. Harel D. Statecharts: A visual formalism for complex systems //Sci. Comput. Program. 1987. №. 8, c. 231-274.
48. Horridgel M.A Practical Guide To Building OWL Ontologies Using The Protege-OWL Plugin and CO-DE Tools Edition 1.0/ Matthew Horridge, Holger Knublauch, Alan Rector, Robert Stevens, Chris Wroe [Электронный ресурс]. - 2004. - Режим доступа : http://www.co-ode.org/resources/tutorials/ ProtegeOWLTutorial.pdf
49. International Standard 1EC 1131-3. Programmable Controllers. Part 3. Programming languages, s.l. : International Electrotechnical Commission. 1993.
50. Neches R., Fikes R., Finin Т., Gruber Т., Patil R.. Senator Т.. Swartout R. Enabling Technology fo Knowledge Sharing // AI Magazine.- Vol. 12,- № 3, Fall 1999.
51. OWHL Web Ontology Language Guide. W3C Recommendation [Электронный ресурс]. - 2004. -Режим доступа : http://www.w3.org/TR/ovvl-guide/
52. RDF/XML Syntax Specification (Revised). W3C Recommendation [Электронный ресурс].-2004. - Режим доступа : http://www.w3.org/TR/REC-rdf-syntax/
53. Shalyto A. A. Technology of Automation-Based Programming, 2004. http://www.codeproject.com/KB/architecture/abp.aspx
54. VERSA Query Language for RDF.W3C Recommendation [Электронный ресурс]. - 2008. -Режим доступа : http://www.w3.org/TR/rdf-Versa-query/
55. UCI Knowledge Discovery in Databases Archive [Электронный ресурс]. - 2005. - Режим доступа : http://kdd. ics.uci.edu/
56. Dictionaries in Databases Archive [Электронный ресурс]. - 2004. - Режим доступа :www.papillon-dictionary.org/info_rnedia/42808971 .pdf
57. Abiteboul S., Duschka О. Complexity of Answering Queries Using Materialized Views // Proc. Of the 17th ACM S1GACT-SIGMOD-SIGART Conference on Principles of Database Systems (PODS'98). Seattle, WA, 1998. P. 254-265.
58. ANS1/N1SO Z39.50-1995. Information Retrieval (Z39.50): Application ServiceDennition and Protocol Specification.
59. ANSI/X3/SPARC Study Group on Data Base Management Systems Interim Report. FDT Bulletin, 7 (2), 1975, pp. 1-140.
60. Baader F., Brandt S., Lutz С. Pushing the EL Envelope // Proc. of the 19th Int. Joint Conf. on Artificial Intelligence (IJCAI 2005). San Francisco: Morgan Kaufmann, 2005. P. 364-369
61. Batini С., Lenzerini M. A Methodology for Data Schema Integration in the EntityRelationship Model. ER 1983, pp. 413-420.
62. Beeri C., Levy A. Y., Rousset M.-C. Rewriting Queries Using Views in Description Logics // Proc. of the Sixteenth ACM SIG-SIGMOD-SIGART Symposium on Principles of Database Systems (PODS'97). N. Y.: ACM Press, 1997. P. 99-108.
63. Berners-Lee T. Weaving the Web.- Harper, San Francisco, 1999.
64. Bhagat R., Pantel P. and Hovy E. 2007. LEDIR: An Unsupervised Algorithm for Learning Directionality of Inference Rules. In Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP-07). pp. 161-170. Prague, Czech Republic. //URL: http://www.patrickpantel.com/Download/Papers/2007/emnlp07.pdf
65. Briukhov D.O., Shumilov S.S. Ontology Specification and Integration Facilities in a Semantic Interoperation Framework. Proc. of the Second Intern. Workshop ADBIS'95. Moscow, 1995. - P. 195-200.
66. Calvanese D., D. Giacomo G., Lenzerini M.,Nardi D., Rosati R. Source Integration in Data Warehousing. University of Roma, 1997.
67. Calvanese D., De Giacomo G., Lembo D., Lenzerini M., Poggi A., Rosati R., Ruzzi M. Data Integration Through N3-LiteA Ontologies // Proc. of the Int. Workshop on Semantics in Data and Knowledge Bases (SDKB 2008): Lecture Notes in Computer Science. Berlin: Springer, 2008.
68. Calvanese D., De Giacomo G., Lembo D., Lenzerini M., Rosati R., Data Complexity of Query Answering in Description Logics // Proc. of the 10th Int. Conf. on the Principles of Knowledge Representation and Reasoning (KR'06). Berlin: Springer, 2006. P. 260-270.
69. Calvanese D., De Giacomo G., Lenzerini M. Answering Queries Using Views in Description Logics // Proc. of the 17th Nat. Conf. on Artificial Intelligence. AAAI 2000. P. 386-391.
70. Calvanese D., De Giacomo G., Lenzerini M., Rosati R. View-Based Query Answering Over Description Logic Ontologies // Proc. of the 11th Int. Conf. on the Principles of Knowledge Representation and Reasoning (KR 2008). Berlin: Springer, 2008.
71. Calvanese D., Giacomo G., Lembo D., Lenzerini M., Rosati R. Conceptual Modeling for Data Integration, http://www.inf.unibz.it/~calvanese/papers/calv-etal-book-mylopoulos-2009.pdf
72. CNews: Рынок ПО: Обзор систем электронного документооборота. http://www.cnews.rU/reviews/index.shtml72002/05/l 7/140012
73. Chawathe S., Garcia-Molina Н., Hammer J., Ireland К., Papakonstantinou Y., Ullman J., Widom J., The TSIMMIS Project: Integration of Heterogeneous Information Sources // Proc. of IPSJ. Tokyo, 1994.
74. http://www.cnews.ru/reviews/index.shtml72002/05/17/140012/.
75. Citforum: безопасность веб сервисов http://citforum.ru/security/internet/web_service/
76. Darwen H. and Date С. The Third Manifesto. SIGMOD Record, v. 24, no 1, March 1995, pp. 3949. (Есть русск. Пер.: X. Дарвин, К. Дейт. Третий манифест //СУБД. - 1996. - № 1. -С. 1 10123.)
77. Date С. An Introduction to Unified Data Language (UN3). Proc. Of the 6th Intern. Conf. on VLDB, New York, 1980, pp. 15-35.
78. Dea Dataset Repository [Электронный ресурс]. - 2001. - Режим доступа : http://www.etm.pdx.edu/ dea/dataset/Latest%20Changes%20v4.doc
79. Digital Libraries Initiative. NSF. http://www.N3i2.nsf.gov/.
80. Ding Y., Fensel D., Klein M., Omelayenko В., Schulten E. The role of ontologies in eCommerce // Steffen Staab, Rudi Studer (ed.), Handbook of Ontologies, 2004.
81. Donini F. M, Lenzerini M., Nardi D., Schaerf A. Deduction in Concept Languages: From Subsumption to Instance Checking // J. Logic Computat. 1994. Vol. 4. No. 4. P. 423-452.
82. Eiji Aramaki, Takeshi Imai, Masayo Kashiwagi, Masayuki Kajino, Kengo Miyo and Kazuhiko Ohe. Toward medical ontology using Natural Language Processing. //URL: http://www.rn.u-tokyo.ac.jp/medinfo/ont/paper/2005-aramaki-l .pdf
83. Eisenberg A., Melton J. SQL/XML is Making Good Progress. SIGMOD Record, Vol. 31, No. 2, June 2002.
84. Genesereth, M. R. and Nilsson, N. J. 1987. Logical Foundation of Artificial Intelligence. Morgan Kaufmann, Los Altos, California.
85. Goasdoué F., Lattes V., Rousset M.-C. The Use of CARIN Language and Algorithms for Information Integration: The PICSEL Project // International Journal of Cooperative Information Systems (IJCIS). 2000. Vol. 9. No. 4. P. 383-401.
86. Goasdoué F., Rousset M.-C. Answering Queries Using Views: a KRDB Perspective for the Semantic Web // ACM Journal - Transactions on Internet Technology (TOIT). 2004. Vol. 4. No. 3. P. 255-288.
87. Goasdoué F., Rousset M.-C. Rewriting Conjunctive Queries Using Views in Description Logics with Existential Restrictions // Description Logics (N3 2000). Aachen, Germany, 2000. P. 113122.
88. Grau B.C., OWL 1.1 Web Ontology Language Tractable Fragments, http://www.w3.org/ Submission/owl 11 -tractable/
89. Gruber Th. What is an Ontology// URL: http://www-ksl.stanford.edu/kst/what-is-an-ontology.html
90. Guarino N. Understanding, Building, and Using Ontologies // URL: http://ksi.cpsc.ucalgary.ca/KAW/KAW96/guarino/guarino.html
91. Horridgel M.A Practical Guide To Building OWL Ontologies Using The Protege-OWL Plugin and CO-DE Tools Edition 1.0/ Matthew Horridgel, Holger Knublauch2, Alan Rectorl, Robert Stevensl, Chris Wroel 1 [Электронный ресурс]. -2004. - Режим доступа : http://www.co-ode.org/resources/tutorials/ ProtegeOWLTutorial.pdf
92. Hovy Е. A Standard for Large Ontologies // URL: http://www.isi.edu/nsf/papers/hovy2.htm
93. Hovy E. Презентации Ontologies: lecture 1 , lecture 2 Issues of Content, lecture 3 Methods for Automated Ontology Building. Information Sciences Institute University of Southern California., с XX летней школы им. В.Матезиуса по лингвистике и семиотике (7-12 марта 2005 г., Карлов университет).
94. Hovy Е., Knight К., Junk M. Large Resources. Ontologies (SENSUS) and Lexicons.//URL:www.isi.edu/natural-language/projects/ONTOLOGIES.html
95. ISO/IEC.9075.14:200x(E). Information technology - Database language - SQL - Part 14: XML Related Specification (SQL/XML). 2001.06.18. Working Draft, http://www.sqlx.org/.
96. I SO/I EC JTC1/SC32 N00368. Database Language SQL - Part 9: Management of External Data (SQL/MED). Final Committee Draft 9075-9. November 1999.
ftp://jerry.ece.umassd.edu/SC32/WG3/Progression_Document/FCD/fcdl-MED-1999-ll.pdf.
97. Jean-Christophe R. Pazzagli, Suzanne M. Embury. Bottom-up Integration of Ontologies in Database Context. KRDB, 1998, 7.1-7.7.
98. Kalinichenko L.A. SYNTHESIS: the language for description, design and programming of the heterogeneous interoperable information resource environment. Institute for Problems of Informatics, Russian Academy of Sciences. Moscow, 1993.
99. Kalinichenko L.A., Briukhov D.O., Skvortsov N.A., Zakharov V.N. Infrastructure of the subject mediating environment aiming at semantic interoperability of heterogeneous digital library collections. Вторая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», Протвино, 2000, с. 78-90.
100. Kalyanpur A. et al. OWL: Capturing Semantic Information using a Standardized Web Ontology Language. // Multilingual Computing & Technology Magazine, Vol. 15, issue 7, Nov 2004. // URL: http://www.mindswap.org/papers/MultiLing.pdf
101. Kogalovsky M.R., Kalinichenko L.A. Refinement of the Synthesis language specification by the ODMG semantics. INTAS-94-1817 Project Report, IPI RAS, Moscow, 1998.
102. Lahiri Т., Abiteboul S., Widom J. Ozone: Integrating structures and semistructured data, http ://www-db. Stanford .edu/pub/papers/ozone. ps.
103. Laks V.S. Lakshmanan, Fereidoon Sadri, IyerN. Subramanian. On the Logical Foudation of Schema Integration and Evolution in Heterogeneous Database Systems. DOOD 1993, pp. 81-100.
104. Levy A. Y., Rajaraman A., Ordille J. J. Querying Heterogeneous Information Sources Using Source Descriptions //Proc. of the International Conference on Very Large Databases (VLDB). N. Y.: ACM Press, 1996. P. 251-262.
105. Levy A.Y. Logic-Based Techniques in Data Integration. Logic-based Techniques in Data Integration. In: Logic Based Artificial Intelligence. Edited by J. Minker. Kluwer Publishers, 2000.
106. Lim Lian-Tze and Kong Tang Enya. Building an Ontology-based Multilingual Lexicon for Word Sense Disambiguation in Machine Translation. // Proceeding of the PAPILLON-2004 Workshop on Multilingual Lexical Databases Grenoble, August
107. Lin D., Pantel P. Concept Discovery from Text // URL: http://www.patrickpantel.com/Download/Papers/2002/coling02.pdf
108. Manolescu I., Florescu D., Kossman D. Answering XML Queries over Heterogeneous Data Sources. Proc. Of the 27th VLDB Conference, Roma, Italy, 2001.
109. Miller G. A., Beckwith R., Fellbaum C., Gross D., Miller K.J. Introduction to WordNet: an on-line lexical database. // International Journal of Lexicography 3 (4), 1990, pp. 235 - 244. // URL: ftp://ftp.cogsci.princeton.edu/pub/wordnet/5papers.ps
110. NLTK: leading platform for building Python programs https://github.com/nltk/nltk/wiki
111. Noy N., McGuinness D. L. Ontology Development 101: A Guide to Creating Your First Ontology. // Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SM1-2001-0880, March 2001. //URL:http://protege.stanford.edu/publications/ontology_deveIopment/ontology 101 .html
112. BlackSeaNew http://www.blackseanews.net/read/68234
113. OWL Web Ontology Language Guide. W3C Recommendation [Электронный ресурс]. - 2004. -Ре-жим доступа : http://www.w3.org/TR/owl-guide/
114. Pantel P. and Pennacchiotti M. 2008. Automatically Harvesting and Ontologizing Semantic Relations. In Paul Buitelaar and Philipp Cimiano (Eds.) Ontology Learning and Population: Bridging the Gap between Text and Knowledge - Selected Contributions to Ontology Learning and Population from Text. ISBN: 978-1-58603-818-2. IOS Press. // URL: http://www.patrickpantel.com/Download/Papers/2008/olp08.pdf
115. Paolini P., Pelagatti G. Formal definition of mappings in a data base. Proc. of ACM SIGMOD Conf., 1977, pp. 40-46.
116. Patel-Schneider P. F., Horrocks I., Motik B. OWL 1.1 Web Ontology Language: Structural Specification and Functional-Style Syntax., eds., 2006. http://www.w3.org/2007/OWL/wiki/Syntax
117. Poggi A., Lembo D., Calvanese D., De Giacomo G., Lenzerini M., Rosati R. Linking data to ontologies // J. on Data Semantics. 2008. P. 133-173.
118. RDF Premier http://www.w3.org/TR/rdf-primer/
119. RDF Vocabulary Description Language 1.0: RDF Schema, http://www.w3.org/TR/rdf-schema/ Calvanese D., De Giacomo G., Lembo D., Lenzerini M., Rosati R. Tractable Reasoning and Efficient Query Answering in Description Logics: The N3-Lite Family // J. of Automated Reasoning. 2007. Vol. 39. No. 3. P. 385-429.
120. RDF/XML Syntax Specification (Revised). W3C Recommendation [Электронный ресурс]. -2004. - Режим доступа : http://www.w3.org/TR/REC-rdf-syntax/
121. RDF/XML Syntax Specification http://www.w3.org/TR/rdf-syntax-grammar
122. Rogushina J. Ontological Approach to Domain Knowledge Representation for Informational Retrieval in Multiagent Systems / J. Rogushina, A. Gladun // International Jornal «Information Theories & Appli-cations». - 2006. - Vol. 13, № 4. -P. 354-362.
123. Rosch, Eleanor. 1981. Prototype classification and logical classification: the two systems. // Ellin Scholnick (ed), New Trends in Conceptual Representation. Hillsdale, N.J.: Erlbaum, 73-85.
124. Sabou Marta. Learning WEb Service Ontologies: an Automatic Extraction Method and its evaluation. //URL: http://kmi.open.ac.uk/people/marta/papers/IOS2005.pdf
125. Fraunhofer Institute Fokus http://www.sweb-project.org.
126. Sibley E.H., Taylor R.W. A data definition and mapping language. Comm. Of the ACM, v. 16, 1973, pp.750-759.
127. Sibley E.H., W.T. Hardgrave, Kogalovsky M.R., Makalsky K.I. A conceptual model to support multi-model external views. Proc. of the Joint U.S.-U.S.S.R. Seminar «Data Models and Database Systems». Austin, Texas. Texas University, 1979, pp. 146-187.
128. Smith K. Michael, Welty Chris, McGuinness L.Deborah. OWL Web Ontology Language. Guide. //URL: http://www.w3.org/TR/owl-guide/
129. Swartz A. The Semantic Web In Breadth // URL: http://logicerror.com/semanticWeb-long
130. Thieme C., Siebes A. Scheme Integration in the Object-Oriented Databases. CAiSE 1993, pp. 5470.
131. Tobies S. Complexity Results and Practical Algorithms for Logics in Knowledge Represen-tation: Ph.D. Dissertation. Aachen, Germany, 2002.
132. Ullman J. D. Information Integration Using Logical Views // Proc. of the 6th International Conference on Database Theory (ICDT'97): Lecture Notes in Computer Science. Berlin. Germany: Springer, 1997. Vol. 1186. P. 19-40.
133. Vacura M., Svatek V., Smrz P. A Pattern-Based Framework for Uncertainty Representation in OntologiesText, Speech and Dialogue. Proceedings of the 11th International Conference TSD 2008, Brno, Czech Republic, September 8-12, 2008. / Eds. P. Sojka, A. Horak et al. LNAI 5246. Springer-Verlag, 2008.
134. Van Heijst, G., Schreiber, A. T., and Wielinga, B. J. 1996. Using Explicit Ontologies in KBS Development. //URL: http://ksi.cpsc.ucalgary.ca/KAW/KAW96/borst/nodel6.html
135. Wen-Syan Li, Chris Clifton. Semantic Integration in Heterogeneous Databases Using Neural Networks. Int. Conf. on VLDB, 1994, pp. 1-12.
136. Wiederhold G. Mediators in the Architecture of Future Information Systems. IEEE Computer 25:3, pp. 38-49, 1992.
137. Wielinga, B. J. and Schreiber, A. T. Reusable and sharable knowledge bases: a European perspective // Proceedings of First International Conference on Building and Sharing of Very Large-Scaled Knowledge Bases. Tokyo, Japan Information Processing Development Center. 1993
138. XQuery 1.0: An XML Query Language. W3C Working Draft, 15 November, 2002.
ДОПОЛНЕНИЕ.
Таблица 4. Сравнение функциональных возможностей СЭД.
Название свойства 1 2 j 4 5 6 7 8 9
Directum DocsVision 1 Globus Professional PayDox 1С: Документооборот БОСС-Референт ДЕЛО ЕВФРАТ МОТИВ
Поддержка различных способов аутентификации 1 2 1 1 1 2 1 1 1
Назначение прав пользователям 2 2 2 2 2 2 2 2 2
Назначение прав группам пользователей 2 2 2 2 2 2 2 2 2
Поддержка пользовательских ролей 2 2 2 2 2 2 2 2 2
Разграничение прав доступа к объектам системы (папка/вид 2 1 2 2 1 2 1 1 2
РКК/экземпляр РКК)
Разграничение прав доступа к
операциям на уровне РКК/прикрепленных файлов/реквизита 1 2 1 1 0 2 2 1 0
Выдача прав на время исполнения поручения/документа 2 1 0 1 0 1 2 2 0
Шифрование данных системы, шифрование данных при передаче 2 2 2 2 2 2 2 2 2
Протоколирование действий пользователей 2 2 2 2 2 2 2 2 2
Средства мониторинга событий (процессов) в системе 1 2 1 2 2 2 1 2 2
Использование ЭЦП 2 2 2 2 2 2 2 2 2
Применение сертифицированных 2 2 2 о 0 о 2 о о
средств криптозащиты
Динамическая блокировка
документа (не подлежащего редактированию/редактируемого другим сотрудником) 2 2 2 2 2 1 2 2 2
Наличие программных средств 0 1 0 0 0 0 0 1 0
контроля целостности документов
Организация резервного копирования базы данных (в том числе по расписанию) 2 2 2 2 2 2 2 2 2
Регистрация документов 2 2 2 2 2 2 2 2 2
Присоединение файлов 2 2 2 2 2 2 2 2 2
Создание документа по шаблону 2 2 2 2 2 0 2 2 0
Создание документа на основе существующего 0 2 0 0 0 0 0 2 0
Регистрация из электронной почты 2 2 0 0 2 2 2 2 2
Регистрация из \¥еЬ0формы 1 2 2 2 2 2 0 2 2
Регистрация документов из М8 01¥юе/0реп01?:1тсе 1 1 0 0 0 0 1 2 0
Регистрация со сканера 1 1 0 0 0 1 0 1 0
Возможность потокового ввода 1 1 0 0 0 1 1 1 0
документов
Работа со словарями и справочниками 2 2 2 2 1 2 2 2 1
Настройки шаблонов регистрационных номеров 2 2 2 2 2 2 2 2 1
Проверка документов на дублирование при регистрации 0 0 0 0 0 0 2 2 0
Встроенные средства просмотра 0 ? 0 0 0 2 0 0 0
прикрепленных документов
Формирование списка рассылки 2 2 2 2 2 2 2 2 2
Работа с проектами документов 2 2 2 0 2 2 2 2 0
Регистрация документа на основе 2 ? 1 1 1 ? ? ? 1
утвержденного проекта
Автоматическая выдача
напоминаний о нарушении срока
рассмотрения, о приближении и 1 1 0 0 0 2 2 2 0
нарушении срока подготовки
проектов
Возможность назначения
ответственного исполнителя по 2 2 2 2 2 0 2 2 2
документу
Возможность использования
промежуточных отчетов по 0 0 0 0 0 2 2 2 0
исполнению
Работа с версиями документов 0 0 2 0 2 2 2 2 2
Ведение папочной структуры документов(номенклатуры дел) 2 2 2 2 2 2 2 2 1
Ведение личных папок пользователя 2 2 2 2 2 2 2 2 2
Установление связи с другими
документами, 2 2 1 1 1 2 1 2 1
зарегистрированными в системе
Работа с документами в режиме (ЖШпе 2 2 2 2 2 2 2 2 2
Поддержка процедур визирования 2 ? 0 0 0 0 ? 0 0
документов
Поддержка процедур согласования 2 2 2 2 2 9 2 9
документов
Ведения листа согласования 2 2 0 2 0 0 2 2 0
Возможность выдачи поручений и подпоручений 2 2 2 2 2 2 2 2 2
Автоматическое протоколирование
доставки, получения и прочтения сообщений в системе 2 2 0 0 0 2 0 2 0
Свой рабочий стол с любого места (удаленный доступ) 2 2 2 2 1 0 2 2 2
Ведение отдельной архивной базы 0 0 0 1 1 1 0 9 0
документов
Создание типовых маршрутов 2 2 2 ? 1 ? 2 9 2
движения документов
Обеспечение свободной маршрутизации документов 2 2 1 2 0 2 0 2 2
Возможность расширения маршрутов движения документов 2 2 2 2 0 2 0 2 2
Поддержка в маршрутах ветвлений (условные переходы) 2 2 1 2 1 2 2 2 2
Возможность отсрочки исполнения 1 2 0 2 0 0 2 0 0
Привязка маршрутов к типам документов, исполнителям и т.д. 2 2 2 1 2 2 2 2 0
Средства автопроцессинга (автоматическая обработка документов) 1 2 2 1 0 1 0 2 0
Механизмы контроля исполнения документов 2 2 2 2 1 2 2 2 2
Автоматическое ведение этапов исполнения работ 2 2 0 2 1 2 2 2 2
Выдача задач на группу 2 2 1 0 0 1 1 0 0
Делегирование полномочий(постоянное/временное) 1 2 1 1 0 1 1 0 0
Контроль за рассмотрением и исполнением документов и поручений в территориально распределенной организации 2 2 2 2 2 2 2 2 2
Обеспечение возможности ввода множества поручений по одному документу и множества исполнителей по одному поручению 2 2 2 1 1 2 2 2 2
Автоматизация приема/отказа поручений к исполнению 1 2 0 0 0 1 1 2 0
Рассылка уведомлений по электронной почте 2 2 0 2 2 2 2 2 2
Рассылка документов на ознакомление 2 2 2 2 2 2 2 1 2
Атрибутивный поиск (поиск по реквизитам документа) 2 2 2 2 2 2 2 2 2
Поиск задач и поручений 2 2 2 2 2 2 2 2 2
Полнотекстовый поиск с учетом морфологии русского языка 1 1 1 1 2 2 1 2 1
Осуществление различных видов поиска в одном запросе 2 2 1 2 2 2 2 2 2
Наличие шаблонов поиска с иерархическим или классифицируемым хранением 1 2 2 0 0 2 2 1 0
Подготовка журналов регистрации документов 2 2 2 2 2 2 2 2 2
Создание отчетов по исполнительской дисциплине 2 2 1 2 2 2 2 2 1
Создание аналитических отчетов по процессам обработки документов 2 2 2 2 0 2 1 2 1
Построение отчетов по результатам поиска 0 2 2 2 0 0 1 2 0
Экспорт отчетов во внешние приложения 2 2 2 2 2 2 2 2 2
Подготовка бумажных документов по шаблону 2 2 2 0 0 0 2 2 0
Вывод на печать формы РКК документа 0 0 0 0 2 0 2 2 0
Подготовка бумажных отчетов по шаблону 2 2 2 2 2 2 2 2 2
Учет места хранения оригиналов документов 2 2 2 2 2 2 2 2 0
Средства проектирования РРК(дизайнер) 2 2 2 2 2 2 2 2 2
Возможность расширения РРК 2 1 1 1 0 2 1 2 1
Возможность использования сложных элементов при проектировании РКК(таблиц, структуры) 0 2 0 0 0 2 0 2 0
Средство разработки типовых маршрутов прохождения документов(дизайнер) 2 2 2 2 2 2 2 2 2
Средство настройки шаблонов
журналов и отчетов, позволяющий
создавать отчетные формы на 2 2 2 2 0 2 2 2 0
основании данных системы
(дизайнер)
Средства создания и настройки 2 2 2 2 2 2 2 о
структуры организации
Средства создания и
редактирования словарей и 2 2 2 2 2 2 2 2 2
справочников
Средства настройки шаблонов документов (MS Office) 2 2 0 1 0 0 1 2 0
Возможность расширения функционала плагинами с использованием общепринятых средств (php, xml, java) 1 2 0 0 0 0 2 2 0
Возможность изменение
интерфейса (под типы пользователей) 1 1 1 2 1 1 1 2 0
Таблица 5. Рейтинг поставщиков СЭД.
№ Компания Доход, млн руб КолОво лицензий в
2008 году
1 ЕМС 325 18000
2 Cognitive Technologies 212,8 30000
3 ЭОС 87,4 29132
4 БОССОреферент 60,4 8700
5 Docsvision 60 16077
6 Интертраст 58 27772
7 Directum 54,0 15000
8 Paybot 50,2 9300
9 Летограф 30 2000
10 Ланит 24,5 7000
11 Магнетософт 10 1200
12 Naumen 9,2 1395
13 Оптима 8,9 5711
14 ЦКР 8,8 1250
15 Питерсофт 6,8 800
16 Ориент Сервис 2,3 650
17 Элевайз 2 450
Таблица 6. Грузооборот ОАО «Морской порт Санкт-Петербург» за 2009-2011 года.
2011
Специализация Грузооборот тыс.тонн за 2009 г. Грузооборот тыс.тонн за 2010 г. Грузооборот тыс.тонн за 2011 г. г. в %% к 2010 г.
ВСЕГО: 50408,4 58059,9 59989,3 103%
НАВАЛОЧНЫЕ, в т.ч.: 7681,6 9024,7 7172,8 79%
Руда 625,8 645,7 687,7 107%
Уголь, кокс 2470,7 2183,2 282,1 13%
Минеральные удобрения 4464,5 6072,5 6036,2 99%
Прочие навалочные 120,6 123,3 166,8 135%
НАСЫПНЫЕ, в т.ч.: 212,2 198,5 250,6 126%
Зерно 203,7 142,0 236,9 167%
Прочие насыпные 8,5 56,5 13,7 24%
ЛЕСНЫЕ 138,7 222,8 194,0 87%
ГЕНЕРАЛЬНЫЕ, в т.ч.: 11649,2 12823,0 13963,2 109%
Черные металлы 4080,9 4522,5 4661,9 103%
Цветные металлы 1802,8 1640,7 1603,5 98%
Металлолом 935,3 1040,6 1219,4 117%
ТарноОштучные 710,4 862,0 892,7 104%
Рефгрузы 2752,3 2621,7 2620,8 100%
Прочие генеральные 1367,5 2135,5 2964.9 139%
КОНТЕЙНЕРЫ 14542,8 19000,1 21978,0 116%
1еиэ 1343675 1931012 2365174
ГРУЗЫ НА ПАРОМАХ 275,8 451,4 691,5 153%
НАЛИВНЫЕ, в т.ч.: 15908,2 16339,4 15739,2 96%
Нефтепродукты 15887,8 16299,2 15677,0 96%
Пищевые 20,4 40,2 62,2 155%
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.