Специализированные базы данных для статистической обработки информации тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Червенчук, Игорь Владимирович

  • Червенчук, Игорь Владимирович
  • кандидат технических науккандидат технических наук
  • 2000, Омск
  • Специальность ВАК РФ05.13.11
  • Количество страниц 228
Червенчук, Игорь Владимирович. Специализированные базы данных для статистической обработки информации: дис. кандидат технических наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. Омск. 2000. 228 с.

Оглавление диссертации кандидат технических наук Червенчук, Игорь Владимирович

Введение

1 Модели представления информации в системах статистического анализа.

1.1 Семантические модели представления данных

1.2 Концепция информационной модели ССОИ

1.2.1 Показатели, объекты, ИП-пространство

1.2.2 Иерархическое меню. Дерево показателей

1.2.3 Дерево объектов.

1.3 Основные задачи исследования информационной модели ССОИ и ее реализации.

1.4 Итоги первой главы.

2 Математическая модель ССОИ й ее исследование

2.1 Свойства информационно-поискового пространства

2.1.1 Свойства дерева объектов.

2.1.2 Выборки и временные ряды в ИП-пространстве

2.1.3 Ковариационные матрицы.

2.1.4 Метрика ИП-пространства.

2.1.5 ИП-ггространство как аксиоматическая модель

2.2 Числовые характеристики иерархической информации

2.2.1 Вес и компактность дерева показателей

2.2.2 Вес или компактность дерева объектов

2.2.3 Характеристики быстродействия поиска показателей.

2.2.4 Характеристика эффективности структуры показателей.

2.2.5 Характеристика быстродействия поиска объекта.

2.2.6 Оценка сложности иерархической информации . 95 2.3 Основные итоги второй главы.

3 Методы построения эффективной системы статистического анализа в условиях большого объема структурированной информации.

3.1 Анализ различных СУБД.

3.2 Структуры хранения исходной информации.

3.3 Структуры хранения оценок статистических характеристик.

3.4 Оценка временных затрат на вычисление статистических характеристик.

3.5 Автоматическая актуализация вторичных данных в БСХ

3.6 Манипуляция данными. Организация статистических расчетов.

3.6.1 Выборки. Сложение выборок. Алгебра А+

3.6.2 Расширенные выборки. Алгебра А+/.

3.6.3 Сопоставления, совмещения, многомерные выборки.

3.7 Повышение скорости доступа к данным в условиях большого объема исходной информации.

3.8 Общая структура реализованной специализированной системы статистической обработки информации

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Специализированные базы данных для статистической обработки информации»

Развивается общество, увеличивается его информационная насыщенность, все сложнее становятся исследуемые информационные объекты, все большее количество показателей требуется для их описания. В данных условиях возрастает роль статистических методов обработки информации, зачастую не имеющих альтернативы при исследовании некоторых сложных систем. Типичным примером подобной системы может служить экологический мониторинг города Омска.

В рамках задачи построения системы для статистической обработки структурированной информации, в частности экологической, основными проблемами являются: во-первых создание модели, отражающей многоуровневую структуру исходных данных, во-вторых адаптация исходных данных для последующего применения процедур статистического анализа, в-третьих наличие достаточного набора процедур и функций для статистического анализа. При всем этом необходимо обеспечить удобство пользователю и простоту диалога с ЭВМ, возможность специалисту в области медицины, экономики, экологии легко общаться с системой.

Примечательно, что заложенные еще в конце 70-ых - начале 80-ых годов нормативы создания статистического программного обеспечения [96], уделяют большое внимание средствам манипуляции и представления исходных данных при статистическом анализе. Однако реализованные на сегодняшний день пакеты статистической обработки при всем многообразии возможностей статистического анализа имеют лишь минимальный набор средств манипуляции и представления данных,

Современные пакеты статистической обработки имеют большой арсенал процедур для статистического анализа, позволяющий специалисту провести более или менее полное исследование. Однако, как правило, исходные данные представляются в виде простых таблиц, т. е. пользователю необходимо осуществлять предварительную подготовку данных (или писать достаточно сложные программы доступа к данным, как в системе STATISTICA [13]). Особенно сложно осуществлять подобную подготовку при исследовании многомерных показателей (multivariate analysis) в условиях большого массива исходной информации, в этом случае на плечи пользователя ложится задача сопоставления нескольких показателей (например, по времени), причем часто приходится проделывать эту процедуру многократно, например чтобы выявить предикторы (причинные переменные) для некоторого процесса или показателя.

Исходными данными для пакетов статистической обработки являются таблицы наблюдений (случаев) по одной или нескольким переменным, однако их получение из исходного материала (первичных данных) остается, как правило, за пределами возможности пакетов. То есть проблема предварительной подготовки данных для статистического анализа (т. е. преобразование информации из первоначального вида в форму, пригодную для последующего статистического анализа) остается нерешенной.

В рамках решения выше перечисленных проблем перспективы использования СУБД для создания систем статистического анализа очевидны. Относительно недавно появилось направление статистических баз данных, обладающих рядом особенностей [43]. Изначально, с распространением персональных компьютеров появился ряд небольших систем статистической обработки баз данных, среди которых можно назвать систему "PROSTO" [39], подсистему "СТАТИСТИКА", работающую в рамках системы "ИСПОЛНИТЕЛЬ" [40], Специализированные базы данных [30] и т.д. В задачу подобных разработок входило создание специализированных баз данных, приспособленных к эффективному реагированию на разного рода запросы пользователя, выполнению функций агрегирования данных. Вся статистическая обработка сводилась к построению отчетов по информации, содержащихся в БД (например, в форме таблиц, содержащей сведения о количестве тех или иных фактографических знаний в БД [39] ), не используя функций вычислений статистических характеристик и процедур статистического анализа как такового.

Описанный в [11] пакет программ по прикладной статистике (1111С) обладает большими возможностями статистического анализа, имеет встроенные программы дескриптивного анализа, регрессионного анализа, статистического прогнозирования и проч. Данная система примечательна тем, что содержит модуль "База данных и графический редактор", позволяющим осуществлять хранение и обработку экспериментальных данных и справочно-учетную информацию к ним, однако данные в этой системе имеют простую структуру.

С появлением развитых систем управления базами данных значительно облегчилась обработка больших массивов информации и стали появляться системы, генерирующие статистические отчеты на основе информации, содержащейся в БД. Примером подобной системы может служить система STAT (Италия. Рим), выполненная с использованием dBase ПТ+ [94]. Данная система позволяет генерировать отчеты по содержащейся в БД информации и представлять их в наглядной форме. По сути здесь на новом уровне (с использованием СУБД) решаются задачи, подобные которым ставились при разработке систем типа "PROSTO" [30, 39, 40] , причем решение этих задач происходит со значительном перекрытием и. со значительно меньшими затратами (в f94] даже приводится весь текст программы).

В последствии стали появляться системы с более развитым набором статистических процедур. Остановимся на система Flexibles statistik

Paket (Германия), выполненная в dBase IV, [92]. Диалог с пользователем производится с помощью меню. Имеются встроенные функции нахождения среднего арифметического, среднего геометрического, среднего гармонического» медианы, минимального и максимального значения (как видим, набор статистических процедур сильно ограничен). Статистической обработке подвергается информация в БД, соответствующая заданным пользователем условиям, потом осуществляется филырация исходной БД, Обработка сложноструктурированных данных в подобной системе затруднена и требует создания специальных дополнительных полей.

Растущая популярность систем, ориентированных на хранение больших объемов информации, стимулирует разработчиков программных средств разрабатывать на их базе системы, поддерживающие многоуровневую структуру. Примеров подобной системы может служить система Oracle Express [551, созданная на базе СУБД Oracle 7, позволяющая производить доступ к многоуровневым данным. Система Oracle Express имеет диалог применения формул, позволяющий производить некоторые процедуры статистической обработки данных, система предоставляет удобный и достаточно понятный интерфейс с пользователем, Развитие подобных систем, поддерживающих OLAP технологию, имеет большие перспективы для организации обработки многомерных данных в распределенных системах.

Проблематика статистических баз данных (СБД) привлекает внимание специалистов ряда крупных научных центров в разных странах. Ей посвящена специальная регулярно проводимая конференция - International Working Conference on Statistical and Scientific Database Management. В рамках этого направления были созданы специализированные статистические СУБД SUBJECT [93] и RAPIDJIOO],

Разработанная в рамках данной работы система статистической обработки информации (ССОИ) является результатом взаимодействия двух направлений информатики: систем управления базами данных и пакетов статистической обработки информации, и вписывается в концепцию СЕД. Такой подход позволяет заметно расширить возможности и повысить эффективность статистической обработки. В данной работе рассматривается комплекс проблем, возникающих при статистической обработке сложно структурирозанной информации, при этом одной из главных задач ставилось обеспечить максимально удобный интерфейс доступа к исходным данным. Данные принципы были использованы при реализации системы специализированных баз данных для статистической обработки экологических данных г. Омска, внедренной Госкомэкологии Омской области в сентябре 1997 г. Однако разработанная система универсальна и может с успехом применяться и в других сходных по виду исследуемых данных отраслях наук: медицине, социологии, экономике. Данная система, будем называть ее "Специализированные базы данных для статистической обработки информации" (ССОИ), нашла свое применение также при эпидемиологических исследованиях, внедрена в Омской государственной медицинской академии & октябре 1997 г.

Предлагаемая в данной работе специализированная система для статистической обработки информации решает проблемы эффективной статистической обработки структурированных данных большого объема, выражаемых системой числовых характеристик.

Актуальность работы.

Тенденция к увеличению объемов и усложнению структуры информации, которую необходимо подвергнуть статистическому анализу, налагает новые требования на создание систем статистической обработки. На первый план выходят проблемы хранения исходных данных и обеспечения удобства работы для пользователя. Основываясь на анализе современного состояния проблемы разработки эффективных систем статистической обработки информации можно сделать вывод о том, что актуальность данной темы определяется:

- отсутствием эффективной семантической модели, ориентированной на данные статистической природы, позволяющей неподготовленному пользователю легко представить данные широкого класса предметных областей;

- недостаточной проработанностью методов оценки эффективности иерархического представления информации, представляющей семантические описания объектов сложной структуры;

- отсутствием до конца формализованного аппарата, позволяющего манипулировать «сырыми» исходными данными с учетом временной привязки, производить их предварительную обработку и выполнять статистическую обработку;

- отсутствием общей математической модели, позволяющей в полной мере отразить основные особенности статистических данных: структурность, однородность, зависимость от времени, и позволяющей реализовать на ее основе эффективную систему статистической обработки с удобным интерфейсом.

При создании систем статистической обработки на первый план выходят проблемы хранения данных и ускоренного доступа к данным. При этом иерархическое структурирование исходной информации является наиболее перспективным направлением решения этих проблем. Однако, применяемые в настоящее время различные подходы к такому структурированию нуждаются в теоретическом обосновании с применением фундаментальных математических исследований.

B основу новой научной концепции иерархического структурирования информационных систем больших объемов, которая предложена в данной работе, положены некоторые идеи информационной алгебры, разработанной группой комитета CODASYL.

В частности, информационная алгебра оперирует понятиями «сущность» и «свойство». Сущности - это физически существующие объекты, элементы реальной системы, имеющей сложную иерархическую структуру, а их свойства суть логические и числовые характеристики, которыми они обладают. Поскольку настоящая работа начиналась с разработки экологического мониторинга г. Омска, то понятие «сущность» здесь трансформировалось в понятие «объект», а понятие «свойство» в показатель. Мир объектов - это частный случай мира сущностей, мир показателей - специфика мира свойств.

Иерархическое структурирование здесь основано на заданной иерархии объектов, на основе которой с учетом семантики описания проектируется классификация показателей, и статистических данных (значений показателей). Данная концепция помимо очевидной практической выгоды, получаемой при разработке специализированных систем для статистической обработки информации, представляет собой еще и немаловажный научный интерес. Подробное теоретическое исследование модели, построенной на данной концепции, приводится ниже.

Иерархия может также служить средством обеспечения интерфейса пользователя. Предложенная в рамках данной работы система иерархических меню позволяет построить удобный интерфейс.

Предложенная модель позволяет пользователю легко описать предметную область или сложный объект в терминах объектов и показателей, то есть легко перейти с сохранением семантики от описания предметной области на неформальном языке данной предметной области непосредственно к формальному описанию в ИП-пространстве, автоматически переводящегося на язык описания в БД ССОИ,

Пель и задачи исследования. Целью диссертационной работы является повышение эффективности создания специализированных систем для статистической обработки информации за счет методов иерархического структурирования больших объемов статистических данных и обоснования общих принципов и новых методов построения систем баз данных, предназначенных для хранения статистической информации.

Основными задачами являются:

- всесторонний анализ возможностей, принятой за основу концепции;

- нахождение численных характеристик эффективности структурирования, позволяющих постановку оптимизационных задач;

- выявление наиболее приемлемого набора стандартных структур данных, образующих ядро системы статистической обработки;

- разработка языка с большими возможностями по манипулированию данными и статистической обработке информации, позволяющего создать удобный интерфейс пользователю;

- разработка методов реализации эффективной системы статистической обработки на базе принятой концепции.

Методы исследования. Разработка специализированной базы данных для ССОИ базируется на использовании теории графов, теории множеств, функционального анализа, теории программирования. При разработке методов и процедур статистической обработки используется аппарат математической статистики.

Научная новизна. В отличие от информационной алгебры здесь по иному вводится система координат. Она основана на понятии информационно-поискового пространства (ИП-пространства), имеющего три измерения, и позволяющего адекватно описывать многоуровневые информационные системы в терминах объектов и показателей. Помимо точек в этом пространстве существуют переменные, временные ряды, совокупности переменных, древовидные структуры значений и т. д. Введена метрика ИП-пространства и доказаны основные его свойства.

Все три измерения ИП-пространства (дерево объектов, дерево показателей, даты) суть корневые деревья, но с различными свойствами и характеристиками. На основании этих характеристик получены макрохарактеристики всей информационной системы, которые предложены в качестве количественных оценок ее быстродействия, компактности и сложности.

Дана оценка сложности иерархического структурирования показателей, предложен критерий оптимальности для структур показателей, выделен класс оптимальных структур.

Дана новая трактовка выборки, введены операции над выборками, построена алгебра выборок, определены основные операции, что послужило основой создания своеобразного языка манипулирования данными.

Предложены и использованы новые научные идеи, позволяющие заполнить пропуски в исходной информации наиболее вероятными значениями. Введены понятия полного и квазиполного ИП-пространства.

Практическая ценность работы. На базе предложенной концепции и разработанных в диссертации принципах структурирования создано математическое обеспечение интерфейса, позволяющее широкому кругу пользователей осуществлять на компьютере иерархическое структурирование больших объектов информации и эффективно эксплуатировать получаемую при этом специализированную базу данных. На базе предлощ^щы* числовых характеристик выработаны рекомендации по структурированию сидт^мы показателей.

Разработанные математическая модель и принципы организации позволили создать эффективную систему статистической обработки, позволяющую специалисту в предметной области производить статистический анализ большого объема исходной информации, имеющей многоуровневую структуру. Предоставляемые пользователю гибкие средства манипулирования данными, формирования запросов, автоматическое сопоставление данных для статистического анализа, настройка режимов работы, дружественный интерфейс вызова статистических процедур и средств визуализации данных позволяют пользователю производить статистическую обработку легко и эффективно.

Имеются акты о внедрении результатов диссертационной работы в научно-практическую деятельность Госкомэкологии Омской области для статистического анализа экологических данных и в научно-исследовательскую деятельность и учебный процесс на кафедре "Эпидемиологии" Омской государственной медицинской академии для проведения ретроспективного и оперативного эпидемиологического анализа с использованием статистических методов.

Основные положения, выносимые на защиту:

1. Предлагаемая концепция моделирования иерархических систем на базе ИП-пространства, дерева объектов и дерева показателей.

2. Разработанная математическая модель представления данных, построенная на основе ИП-пространства.

3. Предложенный аппарат числовых характеристик, позволяющий оценить компактность и быстродействие иерархических структур и систем, сформулировать и решить задачи оптимизации.

4. Разработанная логическая модель исходных данных ССОИ, построенная на основе реляционной платформы.

5. Предлагаемый математический аппарат над выборками, позволяющий построить на его основе мощный и удобный язык манипулирования данными.

6. Методы организации системы статистического анализа, основанные на применении БСХ, множественных индексов позволяющие повысить эффективность системы статистического анализа в условиях большого объема структурированной информации.

7. Методы заполнения пропусков в исходной матрице данных с использованием распределения главных компонент.

В главе 1 дается критический анализ концептуальных моделей представления данных применительно к созданию систем статистической обработки. В результате анализа дается обоснование необходимости разработки новой модели для создания специализированных систем для статистической обработки сложноструктурированной информации большого объема. Предлагается новая концептуальная модель представления данных на основе введенных понятий дерева объектов, дерева показателей, ИП-пространства, позволяющая обеспечить семантическое описание предметной области и создать удобный интерфейс доступа к данным. Производится постановка теоретических задач на всестороннее исследование предложенной модели, конкретизируются задачи реализации некоторой системы статистической обработки на базе предложенной модели представления данных. В данной главе определяется концептуальная и математическая модель ССОИ.

В главе 2 разрабатывается концепция математического моделирования иерархически структурированных информационных систем (производится разработка математической модели ССОИ). На основе исходных абстрактных понятий: показатель, объект, значение показателя - получена математическая модель таких систем. Исследованы свойства введенного в главе 1 ИТТ-пространства. Введены числовые характеристики, позволяющие оценить эффективность результатов иерархического структурирования информации. Предложен критерий оптимальности структур показателей, выделен класс эффективных структур, обоснованы рекомендации по структурированию системы показателей.

В главе 3 на базе принятой концептуальной модели разработана информационная структура исходных данных. Для создания систем статистической обработки предложены и обоснованы подходы, позволяющие значительно ускорить процессы доступа к данным и статистической обработки. С точки зрения теории построения баз данных в данной главе определяется логическая и физическая модель ССОИ как БД. Дается трактовка выборки как математического объекта, построена некоторая алгебра над выборками, определены основные операции над выборками, позволяющие создать мощный и удобный язык манипулирования данными.

В главе 4 рассматривается арсенал статистических процедур, включенных в систему. Усовершенствован метод заполнения пропусков данных с использованием главных компонент, позволяющий повысить надежность восстановления данных, разработано программное обеспечение, включающее программы статистической обработки на основе усовершенствованного автором метода, позволяющие снизить размерность исходных показателей с минимальными потерями информативности, произвести расчеты критериев потери информативности, заполнить пропуски в матрице исходной информации.

Предлагается расширить язык манипулирования данными, основанный на операциях над выборками, операциями над статистическими матрицами на базе соответствующих статистических функций, что позволило создать удобный язык статистических исследований. Для создания систем статистической обработки рекомендован подход многоуровневого вызова статистических процедур, позволяющий увеличить глубину исследования и обеспечить удобство работы с системой; для обеспечения данного подхода были, в частности, решены подзадачи вычисления обобщенного коэффициента корреляции по данным матрицы частных коэффициентов корреляции и нахождения коэффициентов обобщенной модели, учитывающей тенденцию и автокорреляционные зависимости.

В заключении приводятся основные результаты работы.

В приложениях приводятся примеры структур данных, тексты программ разработанных статистических процедур (некоторых из тех, которые основаны на новых принципах), текст головного модуля программы, примеры работы программы, акты внедрения.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 100 наименований, двух актов внедрения, приложений со структурами баз данных, текстами программ и примеров работы системы. Работа содержит 228 страниц печатного текста, в том числе 191 страницу основного текста, работа содержит 27 иллюстраций.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Червенчук, Игорь Владимирович

4.5 Основные выводы к главе 4

1. Для обеспечения возможностей системы по проведению статистического анализа автором разработан комплекс программ, адаптирующих в разработанную систему стандартный набор методов статистической обработки. Все операции над данными в ССОИ удобно представить в виде многоосновной алгебры AQ, объектами (сортами) которой являются выборки, действительные числа, булевы константы, векторы, статистические матрицы.

2. Усовершенствован метод заполнения пропусков данных с использованием главных компонент, позволяющий повысить надежность восстановления данных, разработано программное обеспечение, включающее программы статистической оработки на основе усовершенствованного автором метода, позволяющие снизить размерность исходных показателей с минимальными потерями информативности, произвести расчеты критериев потери информативности, заполнить пропуски в матрице исходной информации.

3. На базе известных методов статистической обработки и предложенных алгоритмов в алгебру АЛ введены операции над статистическими матрицами, позволяющие создать удобный интерфейс пользователю для статистических исследований с помощью статистических матриц. Для создания систем статистической обработки рекомендован подход многоуровневого вызова статистических процедур, позволяющий увеличить глубину исследования и обеспечить удобство работы с системой; для обеспечения данного подхода были, в частности, решены подзадачи вычисления обобщенного коэффициента корреляции по данным матрицы частных коэффициентов корреляции и нахождения коэффициентов обобщенной модели, учитывающей тенденцию и автокорреляционные зависимости.

ЗАКЛЮЧЕНИЕ

Разработаны и научно обоснованы методы построения систем статистической обработки на базе ПЭВМ, реализованные при создании специализированных баз данных для статистической обработки информации (ССОИ), позволяющих эффективно и удобно широкому кругу пользователей производить статистическую обработку многоуровневых данных, при этом решен комплекс задач:

- Разработана концепция моделирования иерархически структурированных информационных систем. На основе исходных абстрактных понятий: показатель, объект, значение показателя -получена математическая модель таких систем, исследованы свойства данной модели.

- Разработана теоретическая основа для обеспечения диалога с пользователем посредством системы иерархических меню, представляющей внешний (пользовательский) уровень представления информации в ССОИ.

- Разработан аппарат числовых характеристик, позволяющий оценить эффективность результатов иерархического структурирования информации. Предложены критерии эффективности структур объектов и показателей, позволившие поставить и решить задачи оптимизации. Определен класс эффективных структур показателей, даны рекомендации пользователю по структурированию системы показателей.

На базе принятой концептуальной и математической модели разработана логическая модель исходных данных ССОИ, построенная на базе реляционной платформы. Для создания систем статистической обработки предложены и обоснованы методы, позволяющие значительно ускорить процессы доступа к данным и статистической обработки. Для создания систем статистической обработки предложен подход, основанный на использовании базы оценок статистических характеристик (БСХ), позволяющий значительно ускорить процесс статистической обработки; данный подход обоснован системой показателей.

Разработан математический аппарат операций над выборками, выделены основополагающие операции сопоставления и совмещения, позволяющие представить весь спектр статистических вычислений и послужившие основой создания языка манипулирования данными ССОИ.

Создана большая библиотека процедур статистической обработки, позволяющая производить первичную обработку данных, корреляционный, регрессионный анализ, анализ с использованием главных компонент, анализ временных рядов, модернизированы методы заполнения пропусков с использованием главных компонент. При этом все операции над данными в ССОИ представляются в виде многоосновной алгебры AQ, объектами (сортами) которой являются выборки, действительные числа, булевы константы, векторы, статистические матрицы. Данная алгебра послужила основой создания языка статистических исследований ССОИ.

Усовершенствован метод заполнения пропусков данных с использованием главных компонент, позволяющий повысить надежность восстановления данных.

- Решены подзадачи вычисления обобщенного коэффициента корреляции по данным матрицы частных коэффициентов корреляции и нахождения коэффициентов обобщенной модели, учитывающей тенденцию и автокорреляционные зависимости, позволяющие, в частности, реализовать принцип многоуровневого вызова статистических процедур. Реализация данного принципа позволила увеличить глубину исследования и обеспечить удобство работы с системой. Параллельно были решены проблемы создания удобного интерфейса пользователя.

Разработанные специализированные базы данных (система статистической обработки информации) позволяют специалисту в предметной области производить статистический анализ большого объема исходной информации, имеющей многоуровневую структуру. Объединение в одну интегрированную систему средств статистического анализа и средств манипулирования данными дает возможность резко увеличить объемы обрабатываемой информации.

Созданная система внедрена в практику. Имеются акты о внедрении результатов диссертационной работы в нучно-исследовательскую деятельность Госкомэкологии Омской области для статистического анализа экологических данных и в научно-исследовательскую деятельность и учебный процесс на кафедре "Эпидемиологии" Омской государственной медицинской академии для проведения ретроспективного и оперативного эпидемиологического анализа с использованием статистических методов. В приложении 10 приводятся копии актов внедрения.

Список литературы диссертационного исследования кандидат технических наук Червенчук, Игорь Владимирович, 2000 год

1. Абилов Б.Г. , Зинченко Н.И. Tiirbo и Arity: два подхода к логическому программированию // - Мир ПК - 1990 - №3 - С 3142.

2. Айвазян С.А. , Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.- 471 с.

3. Айвазян С.А., Енюков И. С. , Мешалкин Л. Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985.- 487 с.

4. Айвазян С.А., Бухштабер В. М., Енюков И. С. , Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности.-М.: Финансы и статистика, 1989.- 607 с.

5. Айвазян С.А. Статистическое исследование зависимостей. М., Металлургия 1968. 227 с.

6. Анализ авторегрессий: Сб. статей. Пер. с англ. М. Наука, 1977. -223с.

7. Андерсон Т. Введение в многомерный статистический анализ. М., Физматгиз, 1963. 500 с.

8. Афифи А., Эйзен С. Статистический анализ, подход с использованием ЭВМ. Пер. с англ. М. Мир, 1982. - 486 с.

9. Бахвалов Н.С. , Жидков Н. П., Кобельков Г.М. Численные методы. М.: Наука, 1987. -208 с.

10. Белов В.А. Работаем в dBase III Plus. Пользователь ПК 3. М.:1. Воким, 1990,- 80 с.

11. Берестижевский С.И., Колосова Т.В., Мартыненко О.Н. Пакет программ по прикладной статистике для персональных ЭВМ // Микропроцессорные средства и системы. 1987. - № 4.

12. Бокс Дж., Дженкинс Г. Анализ временных рядов: прогноз и управление'. М. Мир, 1974. - вып. 1. - 406 с.; вып. 2 - 224 с.

13. Боровиков В.П. Популярное введение в программу STATISTIC А. -М.: КомпьютерПресс, 1998. 267 с.

14. Брябрин В.М. Программное обеспечение персональных ЭВМ. М.: Наука. Гл. ред. физ. мат. лит., 1988. -272 с.

15. Большев Л. Н. , Смирнов Н.В. Таблицы математическойстатистики. М., Наука, 1983. 416 с.

16. Вальд А. Последовательный анализ, М., Физматгиз. 1960.

17. Венецкий И. Г. Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе: Справочник. 2-е изд., перераб. и доп. - М. Статистика, 1979. - 447 с. ил. — (Мат. Статистика для экономистов).

18. Венецкий И. Г. , Кильдищев Г. С. Основы теории вероятностей и математической статистики. Изд. 2-е. М., "Статистика", 1968.- 308с.

19. Вирт. Н. Алгоритмы + структуры данных = программы: Пер. с англ. М. Мир, 1985. - 406 с.

20. Воеводин Г. В. Вычислительные основы линейной алгебры. М Наука, 1977.-304 с.

21. Вучков И., Бояджиева Л., Солаков Е. Прикладной линейный регрессионный анализ. М.: Финансы и статистика, 1987. -287 с.

22. Гирко В. Л. Случайные матрицы. Киев : Радяньска школа, 1975. -488 с.

23. Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике. М.: Статистика, 1972. - 312 с.

24. Гмурман В. Е. Теория вероятности и математическая статистика. Изд. 4-е, доп. Учеб. пособие для вузов. М.: "Высшая школа", 1972. -368 с.

25. Дайитбегов Д.М. Калмыкова О.В. Черепанов А. И. Программное обеспечение статистической обработки данных. М, Финансы и статистика, 1984. - 305 с.

26. Дейт К. Дж. Введение в системы баз данных, 6-е издание: Пер. с англ. К.; М; СПб.: Издательский дом «Вильяме», 1999 - 848 с.

27. Деннинг В., Эссиг Г., Маас С. Диалоговые системы «человек -ЭВМ». Адаптация к требованиям пользователя: Пер. с англ. М. Мир, 1984. 112 с.

28. Демиденко Е.З. Линейная и нелинейная регрессии. М. Финансы истатистика, 1981. 302 с.

29. Драйпер Н. Смит Г. Прикладной регрессионный анализ. Пер. с англ. В 2-х кн. 2-е изд. - М.: Финансы и статистика, 1987. - 392 с.

30. Дружинин А.В., Крапивин А.В., Кукарцев О.В., Трифонов К.И. Специализированные базы данных на персональных ЭВМ. Математические методы обработки информации и управления: Межвед. сб./ МФТИ М. 1998, с. 154 158.

31. Дубровский С. А. Прикладной многомерный статистический анализ. М.: Финансы и статистика, 1982. - 216 с.

32. Дунаев С. Доступ к базам данных и техника работы в сети. Практические приемы современного программирования. М.:

33. ДИАЛОГ МИФИ, 1999-416 с. 33 Дьяконов В.П. Справочник по алгоритмам и программам на языке бейсик для персональных ЭВМ: Справочник. - М. Наука Гл. Ред.

34. Физ. Мат. Лит., 1987.-240 с. 34. Зангвилл У. И. Нелинейное программирование / Пер. с англ. М.1. Сов. радио, 1973. -312 с.

35. Евстигнеев В.А. В.Н. Касьянов В.Н. Алгоритмы на деревьях. -Новосибирск: ВЦ СО АН СССР, 1989. 311 с.

36. Евстигнеев В.А. В.Н. Касьянов В.Н. Алгоритмы обработки деревьев. Новосибирск: ВЦ СО АН СССР, 1990. - 208 с

37. Елисеева И.И., Руковишников В.О. Логика прикладного статистического анализа. М.: Финансы и статистика, 1982. - 316 с.

38. Енюков И.С. Методы, алгоритмы, программы многомерного статистического анализа: Пакет ППСА. М. Финансы и статистика, 1986. - 232 с.

39. Ершов A.M. , Мельникова О.Г. Пащенко Е.А. Сычев П.П. Процессор статистической обработки для СУБД с инвертированными файлами // Сообщения объединенного института ядерных исследований. Дубна, 1990. 8 с.

40. Ефимов А. В. Статистическая обработка реляционных баз данных. Практика автоматизированного управления в машиностроении. Ежегодн. сб. научн. тр. / АН СССР ПО ЗИЛ по пробл. САПР в машиностроении. М, 1989.- №1 - С. 24-28

41. Канатников А.Н., Ткачев С.Б. Программирование в среде Clipper. Версия 5.0 и особенности версии 5.01. М.: Финансы и статистика, 1993. - 240 с.

42. Кендалл М. Дж., Стюарт А. Статистические выводы и связи. Пер. с англ. -М.: Наука, 1973. 899 с.

43. Кендалл М. Дж., Стюарт А. Многомерный статистический анализ и временные ряды. Пер. с англ. М.: Наука, 1976. -736 с.

44. Кендалл М. ранговые корреляции. М.: Статистика, 1975. - 214 с.

45. Кини Р.Л., Райфа X. Принятие решений при многих критериях: предпочтения и замещения: Пер. с англ./ Под ред. И.Ф. Шахнова-М.: Радио и связь, 1981.-560 с.

46. Кнут. Д. Искусство программирования для ЭВМ, т. 2 : Полученныеалгоритмы. М. Мир, 1977. 440 с.

47. Когаловский М.Р. Статистические базы данных //Программирование. 1995.- №2,- С. 37- 47.

48. Кодд Э. Расширение реляционной модели для лучшего отражениясемантики // СУБД. 1996. - №5-6.

49. Костылев А.А., Миляев П.В., Дорский Ю.Д. и др. Статистическая обработка результатов экспериментов на микро-ЭВМ и программируемых калькуляторах : Л. Энергоатомиздат. Ленингр.отделение, 1991.-304 с.

50. Крамер Г., Математические методы статистики. 2-е издание . М.,1. Мир, 1975.-648 с.

51. Куликов М. Я. Червенчук В.Д. Об оптимизации таблиц решений.

52. Кибернетика, 1984. -№ 2, С. 29-34.

53. Липский В. Комбинаторика для программистов: Пер. с польск-М Мир, 1988.-213 с.

54. Лаусон. Ч., Хенсон Р. Численное решение задач метода наименьших квадратов / Пер. с англ. М.: Наука, 1986. - 719 с.

55. Маленво Э. Статистические методы в эконометрии. Перевод с франц. М.: Статистика, 1976, вып. 2, 325 с.

56. Мартин Дж Организация баз данных в вычислительных системах М. Мир. 1980-662 с.

57. Мартынов Г.В. Вычисление предельного распределения статистиккритериев нормальности типа а>2. П Теория вероятностей и ее применение, 1976-т. 21-вып. 1-С. 3 -15.

58. Мартынов Г.В. Вычисление функций нормального распределения. // Итоги науки и техники. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. М., ВНИТИ, 1980, т. 17, С. 57-84.

59. Мартынов Г.В. Критерии омега-квадрат. М. Наука, 1978. 79 с.

60. Менинтгер. Д. Проектирование многомерной базы данных для OLAP.// ORACLE MAGAZINE / RUSSIAN EDITION Лето 1996.

61. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия. М., Финансы и статистика, 1982., вып. 1 224 с.

62. Подиновский В.В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982.-256 с.

63. Поллард. Дж. Справочник по вычислительным методам статистики. М.: Финансы и статистика, 1982. - 384 с.

64. Потапов В. И. , Червенчук И. В. Информационная система статистической обработки экологической информации. // Экология и жизнь (наука, образование, культура ): Международн. сб. статей, -вып. 1.- Новгород, 1996-С. 45-54.

65. Потапов В. И. , Червенчук И. В. Использование главных компонент для снижения размерности исходных показателей. // Вычислительная техника и новые информационные технологии: межвуз. сб. статей. вып. 2. - Уфа, 1999, С. 22 - 29.

66. Потапов В. И. , Червенчук И. В. Статистическая обработка при наличии пропущенных наблюдений с использованием главных компонент.// Вычислительная техника и новые информационные технологии: межвуз. сб. статей. Уфа, 1997 -С. 99 - 105.

67. Пржияловский В.В. Абстракции в проектировании баз данных. // СУБД. 1998. - №1-2,- С. 90-97.

68. Проничева Л. Серверы баз данных. // Мир ПК. 1991.- №11- С. 6371.

69. Романов Б.А. , Кушнеренко А.С. dBase IV. Назначение, функции, применение. М.: Радио и связь, 1991 .-384 с.

70. Саймон А.Р. Стратегические технологии баз данных: менеджмент на 2000 год: Пер. с англ. / Под ред. и с предисл. М.Р. Когаловского. М.: Финансы и статистика, 1999.-479 с.

71. Себер Дж. Линейный регрессионный анализ. М.: Мир 1980 -337с.

72. Сильвестров. Д.С. Программное обеспечение прикладной статистики: Обзор состояния. Тенденции развития. М.: Финансы и статистика, 1988. - 240 с. - (Мат. обеспечение прикладной статистики).

73. Смит Дж, Смит Д. Принципы концептуального проектирования баз данных. // В сб. «Требования и спецификации в разработке программ». М. Мир, 1984.

74. Смит Дж, Смит Д. Абстракции баз данных: Агрегация и обобщение. // СУБД. 1996.-№2 -С.141-160.

75. Смородинский А.В. , Ривкин М.Н. Базы данных: тенденции развития.// Мир ПК. 1990.- №5 - С. 30-36.

76. Статистические методы для ЭВМ. Под ред. К. Эйслейна, Э. Рэлтсона ., Г.С. Уилфа; Пер. с англ. М.: Наука, 1986. - 460 с.

77. Ульман Дж. Основы систем баз данных / Пер. с англ. М.: Финансы и статистика, 1983. - 334 с.

78. Ульман Дж., Уидом Дж. Введение в системы баз данных. М. Издательство «Лори», 2000.

79. Ферстер. Э., Ренц. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. - 356 с.

80. Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений. М.: Мир, 1980. - 280 с.

81. Френкель А.А. Математические методы анализа динамики и прогнозирования производительности труда. М. Экономика, 1972. -190 с.

82. Хан-Магаметов Д. , Ранев К, Зотов А. Парадоксален ли Paradox ? -Компьютер пресс 1991-№11, с. 58-62.

83. Хансен Г., Хансен Д. Базы данных: разработка и управление.: пер. с англ. М. ЗАО «Издательство Бином», 1999. - 704 с.: ил.

84. Хенинен А .Я., Павлов Ю.А. "Статистик-консультант" или еще один довод в пользу неизбежного.// Мир ПК,- 1994.- № 5.

85. Химмельблау Д Прикладное нелинейное программирование. Пер.с англ. М. Мир, 1975. -534 с.

86. Цаленко М. Ш. Моделирование семантики в базах данных- М. Наука. Гл. ред. физ-мат. лит., 1989.-288 с.

87. Чень П. Модель «Сущность-связь» шаг к единому представлению данных. СУБД.-1995.-№3.

88. Червенчук В.Д. Логические функции, таблицы решений и аксиоматическое моделирование: Учебное пособие. Омск: Изд. ОмПИ, 1989.-80 с.

89. Шрейдер Ю. Равенство, сходство, порядок. М.: Наука, 1971. -256с.

90. Экологическая обстановка в Омской области: бюллетень Омского областного комитета по охране природы- Вып. за 1988 1996годы.

91. Эппггейн В.Л., Сенечкин В.И. Языковые средства архитектуры АСУ. М.: Энергоиздат, 1982. -200 с.

92. Achim von Michel. Michel Stief. Fle^ibles statistik-Paket fur dBase IV // Computer PersOtlM. Ausabe 2.- vom 8.1.92.-P. И1-113; Ausabe 3. - vom 22. i .92- S. 89-91.

93. Chen P Shoshani A.SUBJECT: A Directory Driven System for Organizing md Accessing Large Statistical Data Bases. Proc. of the 7th Intern Copf. on У1ЛЖ Cannes, France. September 1981. PP.533-563.94 di Ezio №$■ STAT-1 I M£P COMPUTER .- 96. Rome.

94. Fagin R., Mendelzon A.O., Ullman J.D. A Simplified Universal Relation Assumption and its Propirties // ACM Trans. On Database Systems. -1982. V. 7, №3. - P.343-360.

95. Tansel A. et al., Temporal Databases: Theory, Design, and Implementation (Redwood City, CA: The Benjamin / Cummings Publishing Company, 1993).

96. Turner M.J., Hammond R., Cotton P.A. DBMS for large statistical databases. Proc. of the Fifth Intern. Conf. on VLDB. Rio de Janeiro, 1979. PP.319-327.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.