Интеллектуальные методы организации архивов технической документации научно-производственного объединения тема диссертации и автореферата по ВАК РФ 05.13.12, кандидат технических наук Радионова, Юлия Александровна

  • Радионова, Юлия Александровна
  • кандидат технических науккандидат технических наук
  • 2012, Ульяновск
  • Специальность ВАК РФ05.13.12
  • Количество страниц 302
Радионова, Юлия Александровна. Интеллектуальные методы организации архивов технической документации научно-производственного объединения: дис. кандидат технических наук: 05.13.12 - Системы автоматизации проектирования (по отраслям). Ульяновск. 2012. 302 с.

Оглавление диссертации кандидат технических наук Радионова, Юлия Александровна

Перечень использованных сокращений.

Введение.

Глава 1 Обзор методов и средств автоматизации электронных архивов.

1.1 Основные понятия.

1.2 Общая структура электронных архивов.

1.2.1 Способы организации архивов.

1.2.2 Классификация документов в системе архива.

1.2.3 Общая схема архива технической документации.

1.2.4 Файловое хранилище архива.

1.2.5 Информационное обеспечение архива.

1.2.6 Информационный поиск и информационно-поисковые системы.

1.3 Информационно-поисковые языки и виды классификации документации

1.3.1 Основные определения.

1.3.2 Иерархическая классификация.

1.3.3 Язык предметных заголовков.

1.3.4 Фасетная классификация.

1.3.5 Дескрипторная классификация.

1.3.6 Использование системы весов ключевых слов.

1.3.7 Использование тезаурусов.

1.3.8 Различные системы поиска в архиве электронных документов.

1.4 Требования к организации архива технической документации НПО.

1.4.1 Виды конструкторской, программной, технической документации. Правила учета.

1.4.2 Особенности учета электронных документов.

1.5 Применение алгоритмов автоматической кластеризации при организации электронных архивов.

1.5.1 Принципы кластеризации массива документации.

1.5.2 Формальная постановка задачи кластеризации.

5.3 Алгоритмы кластеризации.

5.4 Применение алгоритмов кластеризации в архиве технической документации.

6 Модели разграничения прав доступа.

6.1 Дискреционная модель.

6.2 Ролевая модель.

6.3 Мандатная модель.

6.4 Требования к системе разграничения прав доступа в архиве технической документации.

7 Обзор возможностей современных автоматизированных систем электронного документооборота и систем электронных архивов.

7.1 Общая схема электронного документооборота.

7.2 Аппаратные и программные требования.

7.3 Система безопасности.

7.4 Взаимодействие с другими системами.

7.5 Хранение истории документа.

7.6 Резервное копирование данных.

7.7 Использование имеющейся информации.

7.8 Коллективная работа с документами.

7.9 Отечественные и зарубежные разработки.

7.10 Сравнительная таблица СЭД.

7.11 Возможность применения СЭД к архивам технической документации

7.12 Анализ возможности использования электронного архива

1С. Предприятие» для организации архивохранилища НПО «Марс».

8 Постановка задачи исследования.

Выводы по главе.

Глава 2 Методы и алгоритмы интеллектуальной организации информации электронного архива технической документации Научно-производственного объединения.

2.1 Классификация технической документации с точки зрения организации архива.

2.1.1 Принципы классификации технической документации.

2.1.2 Алгоритм анализа обозначения документа.

2.1.3 Сравнительный анализ архивной классификации.

2.2 Методика оценки эффективности автоматической кластеризации.

2.2.1 Постановка задачи оценки.

2.2.2 Формализация процесса оценки качества кластеризации.

2.2.3 Алгоритм построения оценочной функции.

2.3 Модель интеграции алгоритмов кластеризации.

2.4 Структурно-функциональное решение программной системы электронного архива технической документации НПО.

2.4.1 Общая структура электронного архива.

2.4.2 Организация поиска в системе электронного архива.

2.4.3 Организация систем оперативного доступа и долговременного хранения

2.4.4 Организация условий хранения. Выбор носителя информации.

2.4.5 Система электронного документооборота отдела технической документации.

2.4.6 Организация общего доступа к информации архива.

2.4.7 Система разграничения прав доступа к данным архивохранилища технической документации на основе использования экспертной классификации документов.

Выводы по главе.

Глава 3 Описание программной системы электронного архива технической документации.

Глава 4 Вычислительные эксперименты.

Рекомендованный список диссертаций по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Введение диссертации (часть автореферата) на тему «Интеллектуальные методы организации архивов технической документации научно-производственного объединения»

В процессе деятельности любой организации, в том числе и научно-производственного объединения, наступает момент, когда становится трудно или даже почти невозможно ориентироваться в накопленном массиве разнообразной документации. Прежде чем управлять информацией об изделии или как-то ее использовать, необходимо организовать ее получение и хранение - то есть создать систему электронного архива. Информация должна накапливаться в процессе жизненного цикла изделия, и должны присутствовать механизмы, обеспечивающие ее накопление и обработку. Как правило, для хранения необходимой информации организуется архив — выделенное помещение, в котором собирается вся необходимая документация. Учет бумажных документов ведет архивариус. При этом архивариус, как правило, не определяет правила доступности документации, а руководствуется решениями руководителей структурных подразделений, которые подписывают заявки на получение документов.

Масса времени сотрудников тратится на поиск того или иного документа или на создание нового, который, возможно, будет повторять то, что уже имеется в архивах.

В качестве основных проблем архивного хранения информации можно выделить следующие:

1) длительность процесса постановки на учет документа архивариусом и получения документа из архива сотрудником предприятия;

2) наличие на предприятии разрозненных архивов бумажной и электронной документации с различными правилами хранения и учета;

3) большой объем бумажной документации, налагающей определенные ограничения на пользование - недоступность документа (документ на руках другого абонента), невозвращение (потеря) документа абонентом, износ документа;

4) наличие бумажных картотек, затрудняющих поиск документов, зато сильно облегчающих «потерю» документа в архиве;

5) отсутствие стандартизованной структуры хранения электронных документов, не позволяющее проводить автоматический подбор комплектов документов;

6) отсутствие взаимосвязи между существующими электронными картотеками разных архивов, приводящее к невозможности осуществлять какие-либо совместные операции с документами, например, проверку комплектности хранимой документации и структуры изделия;

7) невозможность обеспечения оперативной информацией как сотрудников архивов, так и сотрудников других подразделений предприятия;

8) отсутствие системы разграничения доступа для сотрудников предприятия к информации картотек и документации архивов;

9) в системах бумажного документооборота эксперты допускают 15 процентные потери документов при работе [102], в архивах технической документации такие потери недопустимы;

10) отсутствие каких-либо интеллектуальных методов организации и поиска информации.

Возникает необходимость каким-то образом упорядочить накопленную информацию, создать систему, обеспечивающую:

1) быструю регистрацию, классификацию и размещение документов с возможностью отслеживания операторских ошибок;

2) обеспечение целостности информации;

3) оперативный доступ к информации с разграничением прав доступа.

Для организации более эффективной и упорядоченной работы с документацией применяются системы архивных хранилищ и электронного документооборота.

В функции каждого научно-производственного предприятия входит проектирование, разработка и поддержка научно-технической продукции. При создании своих решений предприятие опирается на современные средства и методы обработки информации в рамках корпоративной информационной системы предприятия (КИСП). Одним из центральных звеньев в построении эффективной КИСП является автоматизация деятельности службы архивов технической документации предприятия, обеспечивающих выполнение всего комплекса работ по учету, хранению, тиражированию и обращению технической документации.

Большой объем технической документации, необходимость постоянных корректировок и новых разработок, присущие опытному производству, увеличивают объем работы и усложняют задачи архивных служб. Также проблемой является наличие большого количества бумажных документов.

Правильно организованная система хранения документации не только позволяет ускорить и оптимизировать работу сотрудников архивов и объединить разнородные архивы в единую информационную систему, но и предоставить оперативный доступ к информации архивов всем сотрудникам предприятия.

Информация архива должна быть достоверной и актуальной, поэтому необходимой частью архива является система контроля достоверности и целостности информации.

Процесс предоставления доступа к информации должен опираться на систему разграничения прав доступа, которая является следствием не субъективного восприятия сотрудника-архивариуса, а утвержденной на предприятии системы доступа к документации.

Также в настоящее время все более актуальной становится организация архива не только как совокупности архивных единиц - документов, но и как общей информационной базы предприятия, позволяющей сохранить опыт разработчиков документов и осуществлять поиск информации по содержанию документов.

11 \ "I V

Цель работы

Исследование и разработка эффективных механизмов интеллектуальной организации информации в автоматизированной системе архива технической документации.

Объектом и материалом исследования послужила организация информации в архивах, а также общая система учета, хранения, обращения и изготовления документации отдела технической документации ФНПЦ ОАО «НПО «Марс».

Задачи исследования

1. Провести сравнительный анализ современных систем электронного документооборота и электронных архивов, возможностей существующих поисковых систем, принципов разграничения прав доступа.

2. Разработать структурно-функциональное решение программной системы архива технической документации, алгоритм автоматической классификации документов на основе структуры архива.

3. Рассмотреть возможности алгоритмов кластеризации, в том числе нечеткой, на массиве технической документации. Разработать методику оценки эффективности применения алгоритмов кластеризации для классификации технической документации. Разработать модель интеграции алгоритмов кластеризации для системы архива технической документации.

4. Разработать модель разграничения прав доступа к документации архива в общей информационной системе предприятия, основанной на экспертной классификации и организационной структуре предприятия. Включить разработанную модель в программную систему архива.

Для решения поставленных задач использовались следующие методы исследования: теория кластеризации, метод экспертной оценки специалистов, объектно-ориентированный подход при создании комплекса программ.

Научная новизна положений, выносимых на защиту

1. Методика оценки результатов работы алгоритмов кластеризации на массиве технической документации.

2. Модель интеграции алгоритмов кластеризации для системы архива технической документации.

3. Интегрированный алгоритм кластеризации технической документации.

4. Модель разграничения прав доступа к документации, основанная на экспертной классификации документации и организационной структуре предприятия.

5. Структурно-функциональное решение программной системы архива технической документации, включающее в себя алгоритм автоматической экспертной классификации и подсистему разграничения прав доступа.

Практическая значимость работы

Разработанная система ЭДО и архива используется в работе отдела технической документации ФНПЦ ОАО «НПО «Марс» и позволяет организовать более эффективную работу сотрудников отдела. Система разграничения прав доступа используется в общей информационной системе ФНПЦ ОАО «НПО «Марс», обеспечивая оперативный и удобный доступ к информации архива для всех сотрудников предприятия.

Достоверность результатов диссертационной работы

Достоверность научных положений, выводов и рекомендаций подтверждена результатами вычислительных экспериментов, а также результатами использования созданных алгоритмов и методик в повседневной работе отдела технической документации и общей информационной системе ФНПЦ ОАО «НПО «Марс».

Апробация результатов исследования

Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение: на всероссийской научной конференции с международным участием «Нечеткие системы и мягкие

I } I вычисления» (Ульяновск, 2008), на одиннадцатой национальной конференции по искусственному интеллекту КИИ-2008 с международным участием (Дубна, 2008), на У-й Международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Москва, 2009), на двенадцатой национальной конференции по искусственному интеллекту КИИ-2010 с международным участием (Дубна, 2010), на семинаре с международным участием «Интеллектуальный анализ временных рядов» по результатам НИР, поддержанной ФЦП, проект №02.740.11.5021 (Ульяновск, 2010), на молодежной научно-практическая конференция «Автоматизация процессов управления» (Ульяновск, 2011). Апробация результатов диссертации осуществлялась в работе над системой архивов ФНПЦ ОАО «НПО «Марс». Основные положения и результаты неоднократно докладывались и обсуждались на научно-технических конференциях УлГТУ «Вузовская наука в современных условиях».

Структура и объем диссертационного исследования Диссертационная работа состоит из введения, четырех глав и заключения, содержит 224 страницы машинописного текста, 11 таблиц, 71 рисунок, список литературы из 140 наименований, 6 приложений.

Похожие диссертационные работы по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Заключение диссертации по теме «Системы автоматизации проектирования (по отраслям)», Радионова, Юлия Александровна

Выводы по главе

В третьей главе описан комплекс программ, реализующий теоретические положения диссертационной работы. Структура программного обеспечения отдела технической документации позволяет осуществлять учет и хранение технической документации в соответствии с ГОСТ и требованиями внутренних стандартов предприятия. В картотеки архивов встроен алгоритм автоматической классификации документации. Организация базы данных архивов позволяет осуществлять доступ к данным всем сотрудникам предприятия в соответствии с системой разграничения доступа, корректировка данных карты доступа реализована в отдельном АРМ администратора системы.

В отдельном программном компоненте реализованы функции, необходимые для проведения экспериментов по оценке эффективности работы алгоритмов автоматической кластеризации. В функции пользовательского интерфейса входят:

1) связь с базой данных архивов технической документации, возможность подбора комплекта документации для экспериментов;

2) проведение экспертной классификации массива документации;

3) приведение разнородных данных алгоритмов автоматической кластеризации к единой структуре, формирование матриц соответствия, вычисление оценочной функции;

4) представление результатов экспериментов в виде таблиц базы данных, текстовых файлов, сравнительных графиков.

Для хранения данных использовалась СУБД MS SQL Server 2000, функционирующая на производственном сервере НПО «Марс». Для доступа к данным использовались механизмы ADO, ODBC. Для реализации пользовательского интерфейса использовалась среда программирования Borland Delphi 7.0.

Документация индексируется и кластеризуется с параметрами, дающими оптимальные значения оценочной функции на первом этапе экспериментов. Вычисляются значения оценочной функции.

На третьем этапе подбирается массив документов в объеме небольшого архива, классифицируется экспертом с использованием базы данных, накопленной в процессе проведения первых двух этапов. Затем массив индексируется и проводится процесс кластеризации с параметрами, установленными на предыдущем этапе.

По вычисленным значениям оценочной функции делается вывод об эффективности использования каждого алгоритма кластеризации и наиболее приемлемых параметрах кластеризации.

Дополнительным этапом эксперимента проводится оценка результатов кластеризации с различным значением коэффициента важности критерия.

4.1.2. Результаты экспертной классификации

На первом этапе из архива электронной технической документации выбраны 65 документов преимущественно организационно-нормативного содержания. Проведена экспертная классификация по четырем признакам, и получены следующие количества классов:

- по виду документов - 17 классов;

- по тематике работ - 22 класса;

- по классу документации - 3 класса;

- по разделу документации - 22 класса.

На втором этапе из архива электронной технической документации выбраны 265 документов исключительно организационно-нормативного содержания. Получены следующие количества классов:

- по виду документов - 14 классов;

- по тематике работ - 38 классов;

- по классу документации - 2 класса;

- по разделу документации - 14 класса.

На третьем этапе из архива электронной технической документации выбран 5021 документ различного содержания. Получены следующие количества классов:

- по виду документов - 51 классов;

- по тематике работ - 27 класса;

- по классу документации - 3 класса;

- по разделу документации - 26 классов.

4.1.3. Нормировочные коэффициенты функции соответствия

В процессе проведения экспериментов была выявлена существенная зависимость значения целевой функции от количества классов экспертной классификации и кластеров автоматической кластеризации - чем больше количество кластеров, тем больше строк в матрице соответствия, тем больше слагаемых при вычислении оценочной функции и тем больше значение функции. Например, динамика значений целевой функции для экспериментов Кохонена и видов документации в экспертной классификации по второй части плана экспериментов представлена на рисунке 4.1.1 (по горизонтальной оси - количество кластеров, по вертикальной - значения оценочной функции).

Рисунок 4.1.1 Алгоритм Кохонена. 2 этап экп. Число нейрон ов Радиус актива ции Норма обучен ия Множи тель нормы обучен ия Кол-во класт еров Значение оценочной { зункции

Виды документа ции Издели я Раздел ы Классы

010 6 2 0,9 0,8 12 0,5583 0,5835 0,6403 0,5004

011 6 2 0,8 0,8 14 0,6011 0,6159 0,6546 0,5001

012 5 2 0,9 0,8 8 0,5685 0,5912 0,6665 0,5007

013 5 2 0,8 0,9 4 0,5772 0,5619 0,6673 0,5014

014 5 2 0,8 0,8 8 0,5700 0,5838 0,6489 0,5006

015 5 2 0,8 0,7 4 0,5588 0,5717 0,6099 0,5031

016 5 2 0,7 0,7 19 0,5835 0,6245 0,6357 0,5001

017 5 2 0,7 0,75 14 0,58628 0,6083 0,6285 0,5004

018 5 2 0,7 0,78 14 0,5885 0,6288 0,6532 0,5001

019 6 2 0,8 0,9 15 0,5795 0,5946 0,6398 0,5003

020 6 2 0,9 0,85 12 0,5589 0,5792 0,6317 0,5005

021 7 2 0,7 0,7 34 0,5848 0,635 0,6273 0,5001

022 7 2 0,8 0,7 35 0,5889 0,6522 0,629 0,5001

023 5 2 0,9 0,85 7 0,5765 0,5662 0,649 0,5007

024 5 2 0,8 0,86 7 0,5833 0,5917 0,6679 0,5007

ЗАКЛЮЧЕНИЕ

В качестве основных результатов диссертационной работы можно назвать следующие:

1) проведен сравнительный анализ существующих (из наиболее известных) систем электронного документооборота и электронных архивов. Рассмотрена возможность применения данных систем для архива технической документации научно-производственного объединения. Сделан вывод о недостаточной функциональности существующих систем электронного документооборота и электронных архивов для целей создания основного архива технической документации НПО. Сформулированы требования к системе архива технической документации научно-производственного объединения. Рассмотрены модели разграничения прав доступа, используемые в современных СУБД и системах защиты информации, сформулированы требования к системе разграничения доступа архива электронной документации;

2) разработан алгоритм экспертной классификации технической документации, основанный на структуре архива и номенклатуре документации предприятия;

3) составлен план экспериментов для оценки различных алгоритмов автоматической кластеризации (Кохонена, РСМ и генетического), проанализированы структуры данных полученных результатов работы алгоритмов кластеризации, разработан алгоритм формирования оценочной функции;

4) обработаны результаты экспериментов, проведена сравнительная оценка результатов работы алгоритмов, на основании которой разработана модель интеграции алгоритмов для системы архива технической документации. Сделаны выводы об оптимальном использовании алгоритмов, исходя из заданных параметров алгоритма, характера документации, баланса точности и полноты поиска, предпочтительной близости результатов к определенному признаку экспертной классификации. Проведена сравнительная оценка полноты поиска без использования и с использованием результатов кластеризации;

5) разработано структурно-функциональное решение программной системы электронного архива, удовлетворяющей требованиям, сформулированным в первой главе. Разработана система электронного документооборота отдела технической документации, учитывающая требования к организации архивов электронной и бумажной документации, а также специфику работ по учету, хранению и изготовлению документации научно-производственного объединения;

6) разработана система доступа к файлам электронной документации архива через производственный сервер предприятия. Разработана модель разграничения прав доступа, основанная на структуре архива, экспертной классификации технической документации и организационной структуре предприятия;

7) система архива и система электронного документооборота реализованы в виде совокупности автоматизированных рабочих мест со встроенным алгоритмом экспертной классификации и системой корректировки прав доступа;

8) разработано программное приложение, реализующее функции сравнительной оценки работы алгоритмов автоматической кластеризации.

9) разработанная система архива и электронного документооборота внедрена и используется в отделе технической документации, система доступа к электронной документации используется в корпоративной сети НПО «Марс».

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.