Разработка алгоритмов и процедур повышения точности факторного прогнозирования на основе эволюционной стратегии поиска прогнозирующего описания актуального процесса тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Горелов, Андрей Александрович
- Специальность ВАК РФ05.13.18
- Количество страниц 180
Оглавление диссертации кандидат технических наук Горелов, Андрей Александрович
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ СУЩЕСТВУЮЩИХ.
МЕТОДОВ АППРОКСИМАЦИИ И.
ПРОГНОЗИРОВАНИЯ ПРОЦЕССОВ С ПРЕОБЛАДАЮЩЕЙ
ДЕТЕРМИНИРОВАННОЙ СОСТАВЛЯЮЩЕЙ.
1.1. Определение предметной области.
1.1.1. Необходимость прогнозирования.
1.1.2. Существующие направления развития информационных технологий.
1.1.3. Выбор метода прогнозирования.
1.1.4. Возможные направления развития методов прогнозирования.
1.2. Перечень актуальных задач. ф. 1.2.1. Достигнутые результаты.
1.2.2. Разработка внутренней структуры и механизма функционирования прогнозирующей системы.
1.2.3. Подготовка данных для прогнозирования.
1.2.4. Обеспечение качества прогнозирования.
1.3. Построение всех возможных регрессий.
1.3.1. Предварительные замечания.
1.3.2. Порядок построения.
1.3.3. Метод построения.
1.3.4. Построение только наилучших регрессий.
1.3.5. Пошаговая регрессия.
1.3.6. Другие методы. ц^ 1.4. Выбор критерия.
1.4.1. Коэффициент детерминации R2.
1.4.2. Скорректированный коэффициент детерминации.
1.4.3 .Ср-статистика Мэлоуса.
1.4.4. MSEP-критерий.
1.4.5. Другие меры.
1.5. Основные результаты.
ГЛАВА 2. РАЗРАБОТКА АЛГОРИТМОВ АВТОПОСТРОЕНИЯ АЛГОРИТМИЧЕСКИХ ОПИСАНИЙ ПРОЦЕССОВ НА ОСНОВЕ МЕТОДА ЭВРИСТИЧЕСКОЙ САМООРГАНИЗАЦИИ.
2.1. Общая схема построения алгоритмов, реализующих метод группового учета аргументов.
2.1.1. Описание алгоритма.
2.1.2. Критерии МГУА.
2.2. Разработка модифицированного метода группового учета аргументов на основе процедуры оптимизации частных полиномов (МГУАоп).
2.2.1. Проблемы восстановления функций классическим МГУА и пути их преодоления.
2.2.2 Алгоритм автопостроения модели без использования селекции в последовательных рядах приближения.
2.3. Разработка метода группового учета аргументов на основе дифферальных частных приближений (МГУАдп).
2.3.1. Аппроксимация процессов решениями линейных дифференциальных уравнений.
2.3.2. Результаты аппроксимации процессов решениями линейных дифференциальных уравнений.
2.4. Разработка метода группового учета аргументов на основе самоорганизующихся искусственных нейронных сетей (МГУАнс).
2.4.1. Математическая постановка задачи.
2.4.2. Постановка и возможные пути решения задачи обучения нейронных сетей.
2.4.3. Нейронная сеть с обучением по методу обратного распространения ошибки.
2.2.4. Автоматическое построения «наилучшей» искусственной нейронной сети.
2.2.5. Метод группового учета аргументов на основе аппарата нейронных сетей.
2.5. Основные результаты.
ГЛАВА 3. РАЗРАБОТКА ПРОЦЕДУР АВТОМАТИЧЕСКОГО ВЫБОРА СТРУКУТУРЫ МОДЕЛИ, ОЦЕНКИ ЕЕ ПАРАМЕТРОВ И ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО ОБЪЁМА ВЫБОРКИ.
3.1. Предварительные замечания.
3.2. Автоматизация построения модели для прогнозирования процессов с детерминированной составляющей методом экстраполяции тенденций
3.2.1. Классический способ выбора структуры и вычисления параметров прогнозирующей модели в методе экстраполяции тенденций.
3.2.2. Принципы организации программной системы автоматического синтеза структуры и оценки параметров прогнозирующих функций.
3.2.3. Выбор адекватной стандартной функции по результатам анализа характеристического отношения.
3.2.4. Способ автоматического выбора структуры модели, оценки её прогнозирующей силы и определения наилучшей длины обучающей последовательности с помощью тестовой последовательности.
3.3. Методика построения прогнозирующей регрессионной модели.
3.3.1. Основные положения методики построения модели.
3.3.2. Устойчивость модели и способы её оценки.
3.3.3. Векторный показатель качества прогнозирующей модели.
3.3.4. Проверка гипотез относительно параметров модели.
3.3.5. Использование векторного критерия качества модели в процессе поиска лучшей модели.
3.4. Основные результаты.
ГЛАВА 4. МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ ПОКАЗАТЕЛЕЙ ПРОИЗВОДСТВЕННОГО ТРАВМАТИЗМА В РОССИЙСКОЙ ФЕДЕРАЦИИ И РЕЗУЛЬТАТЫ ПРОГНОЗА.
4.1. Подготовка данных для окончательного прогноза показателей травматизма до 2005 года.
4.1.1. Сценарные условия.
4.1.2. Исходные данные для решения задачи прогноза.
4.2. Прогноз показателей производственного травматизма на основе выявления и экстраполяции тенденций.
4.3. Характеристики финальных прогнозирующих моделей показателей травматизма с помощью факторного регрессионного анализа.
4.4. Характеристики моделей для прогнозирования показателей травматизма с помощью нейросетевых технологий.
4.6. Сравнительные результаты прогноза показателей травматизма.
4.7. Окончательный прогноз показателей производственного травматизма до 2006 года.
4.8. Графическое представление результатов моделирования и прогноза
4.9. Основные результаты.
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Разработка алгоритмов и процедур повышения надежности и точности прогнозирования процессов, представленных короткими временными рядами2005 год, кандидат технических наук Ермаков, Вячеслав Владимирович
Разработка алгоритмического обеспечения систем управления космическими летательными аппаратами2008 год, кандидат технических наук Ким Чжэ Су
Разработка математического и программного обеспечения автоматизированного прогнозирования временных рядов на основе нейрокомпьютерных технологий2003 год, кандидат технических наук Артемкин, Денис Евгеньевич
Модели прогнозирования процессов, представленных временными рядами с короткой актуальной частью2011 год, кандидат технических наук Скворцова, Татьяна Сергеевна
Разработка методов и устройств автоматического прогнозирования состояния каналов аналоговых систем передачи1984 год, кандидат технических наук Исаев, Рихси
Введение диссертации (часть автореферата) на тему «Разработка алгоритмов и процедур повышения точности факторного прогнозирования на основе эволюционной стратегии поиска прогнозирующего описания актуального процесса»
Актуальность проблемы. Перманентная потребность в повышении эффективности и действенности управленческих решений и организационных планов достаточно очевидна. Конкурентная борьба на рынке товаров и услуг, стремление максимизировать прибыль предприятия и минимизировать издержки производства, желание локализовать и уменьшить последствия аварий и техногенных катастроф стимулируют работы, нацеленные на повышение точности и надежности прогноза процессов различной физической и социальной природы, представленных временными рядами данных. Подавляющее большинство социально-экономических процессов могут быть кате-горированы как процессы с детерминированной составляющей. В настоящее время существует значительное количество методов моделирования и прогнозирования таких процессов, такие как классический и специальный регрессионный анализ, искусственные нейронные сети, эволюционные стратегии, системы одновременных уравнений, метод выявления и экстраполяции тенденций, авторегрессия и так далее.
Одновременно с этим, в настоящее время практически отсутствует математическое и программное обеспечение, нацеленное на автоматическое построение наилучшего формализованного описания проблемного социально-экономического процесса в классе всех возможных описаний. Создание такого обеспечения сопряжено с необходимостью разработки методов поиска наилучшего описания. Эти методы должны включать:
1) средства квалификации проблемного процесса и определения адекватного класса методов для его моделирования;
2) векторные показатели качества аппроксимации процесса;
3) алгоритмы многокритериального поиска решения в различных классах методов моделирования.
Средства квалификации проблемного процесса должны реализовывать эвристические алгоритмы, методы теории групповых решений и механизмы логического вывода с развиваемой базой знаний.
Успешное решение поставленных проблем позволит существенно повысить эффективность создания прогнозирующих моделей, применяемых для анализа и прогноза показателей социально-экономической сферы, в частности, для прогнозирования результатов производственно-хозяйственной деятельности предприятий, а также социальных и политических процессов в стране. Полученные результаты найдут широкое применение при создании информационно-аналитических систем в соответствии с концепциями оперативной аналитической обработки (OLAP) и интеллектуального анализа данных (Intelligent data analysis). Принципиально новыми элементами разрабатываемой концепции моделирования и прогнозирования проблемных процессов является внедрение и интенсификация использования процедур альтернативного моделирования и обобщения альтернативных результатов, механизмов мониторинга состояния информационного обеспечения, процессов решения задач прогноза, актуализации моделей, идентификация параметров которых становится возможной по мере накопления статистического материала.
Актуальной темой современной теории моделирования и прогнозирования процессов остаётся задача оценки коэффициентов множественной регрессии в различных «специальных» условиях, которая неявно основывается на предположении существования жестких причинно-следственных отношений между факторными признаками и результативным признаком. Это предположение и порождает традиционные подходы к семантической интерпретации коэффициентов множественной регрессии. В то же время в реальных условиях для прогнозирования процессов достаточно наличия только косвенных причинно-следственных связей, порожденных наличием общих закономерностей в процессах изменения факторных и результативных признаков, примером вышесказанного может служить метод прогнозирования на основе сценарных условий.
Сценарные моделирование и прогнозирование основаны на делении социально-экономических показателей на две группы (факторные и результативные показатели, или признаки) и построении модели зависимости вторых показателей от первых. Деление на указанные группы достаточно услов-^ но, жестких руководящих принципов осуществления такого деления нет, хотя определенная традиция уже сформировалась.
К факторным показателям относят те, которые считают условно управляемыми, т.е. планируемыми. Прогнозирование этих показателей осуществляется, главным образом, экспертным путем. Конечно же, при этом могут использоваться и методы математического моделирования, включая метод выявления и экстраполяции тенденций, аппроксимирующие дифференциальные уравнения, системы одновременных разностных уравнений, искусственные нейронные сети и т.д.
Группу результативных (проблемных) показателей образуют многочисленные прочие показатели. Моделирование и прогнозирование этих показателей также могут осуществляться различными методами, но при прогнозе на основе сценарных условий обычно используется линейная множественная регрессия, в которой в качестве регрессоров используются факторные экзо->41. генно задаваемые «управляемые» («входные») показатели.
В практике прогнозирования многих процессов, в том числе и социально-экономических, типична ситуация, когда объем статистических данных невелик. В таких условиях результаты прогноза, полученные по разным методам, как правило, существенно отличаются друг от друга. Кроме того, ни один из существующих методов решения задачи прогноза не обладает явными преимуществами и не может быть использован как предпочтительный. Решением данной проблемы может служить одновременное использование нескольких альтернативных методов, таких как регрессионный анализ, метод выявления и экстраполяции тенденций, метод прогноза поведения процесса и т.д., в сочетании с процедурой согласования (обобщения) альтернативных результатов прогноза.
Существует множество параметров, оценивающих качество прогноза, но практически все они являются показателями качества аппроксимации и, основываясь на предположении, что прогнозируемый процесс не меняет своего поведения в дальнейшем, используются как показатели прогнозирования. ^ Использование показателей аппроксимации в качестве показателей прогнозирования не является очевидным, но из-за отсутствия последних - это наиболее приемлемое решение. Все это подтверждает необходимость введения новых показателей качества прогноза.
В настоящее время в области моделирования процессов с детерминированной составляющей чётко обозначилась актуальность задачи повышения уровня автоматизации процессов построения. Создание средств высокоуровневого моделирования и прогнозирования позволит расширить и интенсифицировать применение современных высокоэффективных методов разработки прогноза, что, в свою очередь, позволит повысить качество и своевременность принимаемых управленческих решений и планов.
При разработке теории и методов моделирования и прогнозирования процессов охватывается широкий круг математических и прикладных проблем, в развитие которых значительный вклад внесли российские и зарубеж-41 ные ученые: В.М. Глушков, А.А. Амосов, В.А. Трапезников, В.А. Котельников, А.А. Харкевич, Б.Р. Левин, Л.М. Финк, ЯЗ. Цыпкин, С.М. Самойленко, Р.Л. Стратонович, В.И. Тихонов, Д.А. Поспелов, B.C. Шварцман, Э.Л. Блох, И.А. Мизин, Ю.М. Мартынов, Л.П. Пуртов, А.Н. Тихонов, М.Л. Лидов, Н.Дрейпер, Г.Смит, А.Алберт, Дж.Себер, Ф.Уоссермен, Дж.Форрестер и др. В разработку современных концепций организации хранения, представления и автоматизированного анализа данных наибольший вклад внесли Дж.Тьюки, Э. Кодд, В. Инмон.
Задача повышения уровня автоматизации неотрывно связана с задачей автоматического выбора адекватных прогнозирующих описаний проблемных процессов, для решения которой необходима разработка средств квалификации, многоальтернативного моделирования и обобщения альтернативных результатов, интерпретации и формирования итогового отчёта.
Многоальтернативное моделирование и процедуры обобщения результатов альтернативного прогноза необходимы не только для осуществления возможности автоматического поиска адекватной прогнозирующей модели, но и для решения проблемы углубления степени извлечения информационного содержимого из имеющегося статистического материала, поэтому, несмотря на обилие существующих методов прогнозирования процессов с детерминированной составляющей, в контексте проблемы разработки многоальтернативных прогнозов сохраняется актуальность задач разработки новых и улучшения известных методов построения прогнозирующих описаний. Актуальностью этих задач обусловлен выбор цели и задач диссертационной работы.
Целью работы - является повышение точности и надёжности прогнозирования процессов с преобладающей детерминированной составляющей, в частности, социально-экономических процессов за счет повышения эффективности и уровня автоматизации процедур построения адекватных формализованных описаний и их применения для решения задач прогноза.
Задачи исследования. Для достижения целей диссертационной работы необходимо решение следующих задач.
1. Разработка методики автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии.
2. Разработка векторного показателя качества — совокупности показателей, по которым осуществляется сравнение вариантов описания зависимости проблемного показателя от факторных признаков, а также способа применения векторного показателя качества для сравнения частных описаний, то есть способ многокритериального сравнения вариантов модели.
3. Разработка программного комплекса, реализующего предложенную методику поиска лучшей регрессионной модели.
4. Разработка способа автоматического определения наилучшего описания процесса в методе выявления и экстраполяции тенденций.
5. Разработка альтернативных алгоритмов автоматического построения математических моделей, основанных на эвристической самоорганизации, отличающихся структурой интегрирующего ядра, оптимизацией частных приближений и способом формирования популяции описаний.
Методы исследования. При выполнении работы использовались теория математического моделирования, методы вычислительной и прикладной математики, статистическое и имитационное моделирование, эвристическое программирование.
Научная новизна работы состоит в следующем:
1. Предложена методика построения модели линейной множественной регрессии, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию, что повышает полноту анализа вариантов и объективность получаемых результатов.
2. Предложена совокупность показателей качества прогнозирующих описаний, включающая показатели структурной и параметрической устойчивости модели, что гарантирует выбор среди возможных альтернатив описания с наибольшей прогностической силой.
3. Разработан способ автоматического определения наилучшего описания процесса в методе выявления и экстраполяции тенденций оригинален, аналогов не имеет, обеспечивает автоматический выбор адекватного описания и автоматическое определение наилучшей по критерию минимума сред-неквадратической ошибки длины обучающей последовательности.
4. Разработаны алгоритмы автоматического построения математических моделей, основанные на методе эвристической самоорганизации, отличающиеся возможностью изменения структуры интегрирующего ядра (полиномы 2-й степени, дифференциальные уравнения 2-го порядка, искусственные нейронные сети), оптимизацией частных приближений и способом формирования популяции описаний, что обеспечивает повышение показателей качества формируемых алгоритмических описаний моделируемых процессов за счёт синтеза структуры модели, наиболее адекватной составу факторных признаков и специфике изучаемого процесса.
5. Предложена методика разработки прогноза социально-экономических показателей, отличающаяся применением альтернативных прогнозирующих моделей, что обеспечивает наиболее полное использование информационного содержимого имеющихся статистических данных.
Практическая ценность. Полученные результаты являются существенной, но всё же начальной частью реализации концепции создания математических и программных средств для интегрированной высокоуровневой системы моделирования и прогнозирования социально-экономических процессов, обеспечивающий высокий уровень доступности современных методов прогнозирования широкому кругу аналитиков и управленцев. Основные результаты нашли отражение в программах:
Mavin" - программа интеллектуальной аппроксимации и прогнозирования процессов с детерминированной составляющей;
NeuroMap - программа моделирования зависимостей скалярной величины от векторного аргумента и прогнозирования экономических процессов на основе технологии искусственных нейронных сетей;
Factj>r - программа эвристического поиска решения предназначена для автоматического построения линейной факторной прогнозирующей модели процесса изменения во времени показателей социально-экономической сферы.
Система Factpr внедрена в Федеральной службе государственной статистики. Результаты диссертации успешно использованы при разработке прогнозов показателей занятости населения РФ в экономике страны, показателей производственного травматизма («Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом, чел.», «Численность пострадавших со смертельным исходом, чел.», «Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1000 работающих», «Численность пострадавших со смертельным исходом в расчете на 1000 работающих», «Число дней нетрудоспособности у пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1 пострадав-W шего») в РФ.
Внедрение результатов. Результаты диссертационной работы внедрены: в Федеральной службе государственной статистики и используется для прогнозирования показателей занятости населения Российской Федерации (численность безработных, численность занятых в экономике, численности экономически активных и неактивных); в учебный процесс студентов специ-ф альности 220400, 351400 в Рязанской государственной радиотехнической академии.
Внедренный программный продукт имеет свидетельство №5020050719 от 27.05.05 об официальной регистрации программы «Программа эвристического поиска решения» (краткое название "FactPr" vl.l) для ЭВМ в Отраслевом фонде алгоритмов и программ (ОФАП) Государственного координационного центра информационных технологий Минобразования России.
Основные результаты, выносимые на защиту:
1. Методика автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии, предназначенная для прогнозирования методами сценарных условий и лагированных переменных.
2. Понятие и способ применения векторного показателя качества в процессе поиска «наилучших» прогнозирующих описаний.
3. Программный комплекс, реализующий предложенную методику поиска лучшей регрессионной модели.
4. Способ автоматического определения «наилучшего» описания процесса в методе выявления и экстраполяции тенденций.
5. Алгоритмы автоматического построения математических моделей, основанные на эвристической самоорганизации, включающие процедуры оптимизации частных приближений, решения аппроксимирующих дифференциальных уравнений и синтеза искусственных нейронных сетей как механизма интеграции частных приближений.
Апробация работы. По теме диссертации сделаны доклады на 10-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2001 г.; 11-ой Международном научно-техническом семинаре «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2002 г.; 12-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; 13-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; VII Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права», Москва, 2004 г.
Публикации. Основные результаты диссертационной работы опубликованы в 8 печатных работах, получены 3 свидетельства о регистрации программы для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и трех приложений. Основной текст содержит 170 страниц, 29 таблиц, 12 рисунков. Список литературы состоит из 136 наименований. Приложения выполнены на 8 страницах.
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Разработка математического и программного обеспечения системы оптимизации технико-экономических показателей энергогенерирующего предприятия на основе теории интервального регрессионного анализа и эвристической самоорганизации1998 год, кандидат технических наук Васильев, Сергей Владимирович
Оптимизация рекуррентных моделей временных рядов на основе B-сплайнов 2-го и 3-го порядков2008 год, кандидат физико-математических наук Эшаров, Элзарбек Асанович
Долговечность интегральных схем и методы ее прогнозирования2006 год, доктор технических наук Строгонов, Андрей Владимирович
Нейросетевая реализация процедуры идентификации динамических систем2000 год, кандидат технических наук Гаврилов, Александр Игоревич
Модели и методы прогнозирования производительности труда и производственной мощности строительно-монтажных организаций энергетического строительства в условиях АСУ1983 год, кандидат технических наук Браверман, Вячеслав Яковлевич
Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Горелов, Андрей Александрович
4.9. Основные результаты
Определены структура и параметры прогнозирующих моделей для окончательного прогноза показателей травматизма на 2003-2006 годы, получены результаты окончательного прогноза, оценены характеристики полученных моделей, также выявлены тенденции поведения показателей травматизма РФ в будущем.
Построены модели для показателей травматизма на основе выявления и экстраполяции тенденций. Получены результаты, которые не в полной мере совпадают с результатами, полученными при факторном прогнозировании.
В результате эвристической самоорганизации получены структуры (по числу показателей травматизма) искусственной нейросети, наилучшим образом описывающие той или иной, показатель травматизма. Вычислены характеристики (веса) полученных нейросетей, получены результаты прогнозирования. Сравнение результатов прогнозирования факторной регрессионной и нейросетевой регрессионной моделей не позволяет выявить доминирующий метод при прогнозировании показателей производственного травматизма. Каждый из методов является лучшим при прогнозировании определенного показателя травматизма. В качестве окончательного прогнозного значения для всех показателей кроме показателей Т4 «Число пострадавших со смертельным исходом в расчете на 1000 работающих » и Т5 «Число человеко-дней нетрудоспособности на 1 рабочий день и более, временная нетрудоспособность которых закончилась в отчетном году, в расчете на 1000 человек», предложено использовать среднее геометрическое значение частных прогнозов. Для показателей Т4 и Т5 в качестве окончательного прогноза использован частный прогноз, полученный методом прогноза поведения процесса.
155
ЗАКЛЮЧЕНИЕ
Выполненная диссертационная работа включает исследования, направленные на разработку методов, алгоритмов и программ для решения задач, связанных с прогнозированием процессов с преобладающей детерминированной составляющей. Предметными областями применения результатов диссертации явились: занятость населения РФ в экономике страны, производственный травматизм в РФ, оптовый рынок электроэнергии. В диссертации представлен подробный анализ задач прогнозирования процессов с преобладающей детерминированной составляющей, выявлены задачи, решение которых позволит повысить надежность и точность прогноза. Реализовано программное обеспечение для решения актуальных задач. В качестве иллюстрирующих примеров в работе приведены решения конкретных задач прогнозирования социально-экономических процессов в РФ. Основные результаты работы состоят в следующем.
1. Проведён анализ вопросов, ассоциированных с проблематикой моделирования и прогнозирования процессов с преобладающей детерминированной составляющей. Показано, что в контексте создания современных информационно-аналитических систем для прогнозирования социально-экономических показателей наиболее актуальными являются задачи разработки алгоритмов и процедур автоматического выбора адекватного метода прогнозирования и автоматического определения структуры формального описания. Определены основные проблемы, возникающие при прогнозировании процессов с детерминированной составляющей. Описан принцип, порядок и метод построения всех возможных регрессий, а также метод построения пошаговой регрессии. Описаны основные критерии прогноза (коэффициент корреляции, скорректированный коэффициент корреляции, Ср-статистика Мэлоуса, MSEP-критерий и другие), приведен метод выбора критерия, по которому осуществляется прогноз.
2. Разработаны алгоритмы автоматического построения формализованных описаний процессов, основанные на методе эвристической самоорганизации, которые отличаются от аналогов структурой интегрирующего ядра, оптимизацией частных приближений и способом формирования популяции описаний, что обеспечивает повышение показателей качества формируемых алгоритмических описаний моделируемых процессов. Разработан модифицированный алгоритм группового учета аргументов на основе процедуры оптимизации частных полиномов МГУАоп. Модифицированный метод отличается реализацией дополнительной процедуры подбора оптимальной степени полинома частного приближения (в классических алгоритмах используется "опорный" полином. Разработан модифицированный алгоритм группового учета аргументов на основе диф-феральных частных приближений МГУАдп. Для улучшения качества получаемых описаний предлагается в процессе реализации многорядных построений использовать не полиномиальные, а дифферальные частные приближения. Разработан модифицированный алгоритм группового учета аргументов на основе искусственных нейронных сетей МГУАнс. Для улучшения качества получаемых описаний предлагается в процессе реализации многорядных построений использовать алгоритмические описания в виде самоорганизующихся нейронных сетей.
3. Показано, что существующие методы поиска наилучшей множественной регрессии основаны на применении одного критерия показателя качества модели. Одновременно с этим единственный критерий качества, который достаточно адекватно характеризует прогнозирующие способности модели, в настоящее время не найден. Это обусловливает необходимость применения в практических методиках построения прогнозирующих описаний векторного показателя качества. Предложен векторный показатель качества прогнозирующей модели, А также способ его применения для сравнения частных описаний, то есть способ многокритериального сравнения вариантов модели. Предложена совокупность новых показателей качества ЛМР, предназначенной для решения задачи прогнозирования на основе сценарных условий, названные показателями параметрической и структурной устойчивости прогнозирующего описания. ^ 4. Разработана методика построения «наилучшей» прогнозирующей линейной модели, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию. Разработан алгоритм поиска наилучшей регрессии, отличающийся использованием векторного показателя качества, в методе прогнозирования на основе сценарных условий.
5. Определены структура и параметры прогнозирующих моделей для окончательного прогноза показателей травматизма на 2003-2006 годы, получены результаты окончательного прогноза, оценены характеристики полученных моделей, также выявлены тенденции поведения показателей травматизма РФ в будущем. Построены модели для показателей травматизма на основе выявления и экстраполяции тенденций. В результате эвристической самоорганизации получены структуры (по числу показателей травматизма) искусственной нейросети, наилучшим образом описы-щ вающие той или иной, показатель травматизма. Вычислены характеристики (веса) полученных нейросетей, получены результаты прогнозирования. В качестве окончательного прогнозного значения для всех показателей кроме показателей Т4 «Число пострадавших со смертельным исходом в расчете на 1000 работающих » и Т5 «Число человеко-дней нетрудоспособности на 1 рабочий день и более, временная нетрудоспособность которых закончилась в отчетном году, в расчете на 1000 человек», предложено использовать среднее геометрическое значение частных прогно-^ зов. Для показателей Т4 и Т5 в качестве окончательного прогноза использован частный прогноз, полученный методом прогноза поведения процесса.
Результаты диссертационной работы могут использоваться в качестве основы для создания и дальнейшей реализации концепции создания математических и программных средств для интегрированной высокоуровневой системы моделирования и прогнозирования социально-экономических про-^ цессов. Дальнейшее развитие положений диссертации могут быть направлены на развитие и реализацию отдельных компонентов данной системы, в частности необходимы исследования в следующих направлениях:
1) создание системы формирования исходных данных на основе статистического материала;
2) построение иерархических многошаговых методов моделирова-фч. ния прогнозирования процессов;
3) разработка новых алгоритмов консолидации результатов прогнозов;
4) разработка новых алгоритмов определения свободных параметров прогнозирующих описаний;
5) разработка новых алгоритмов многокритериального поиска решения в различных классах методов моделирования;
6) создание информационной системы пополнения банков алгорит-ф мов и моделей;
7) разработка новых критериев качества прогноза;
8) развитие системы формирования отчетов в сторону расширения форматов представления результатов.
Список литературы диссертационного исследования кандидат технических наук Горелов, Андрей Александрович, 2005 год
1. Aczel A.D Complete business statistics. 3rd ed. Richard D. Ir-wing, 1996. - 869 p.
2. Chatfield C. The Analysis of Time Series: an Introduction, 4th ed. -Chapman and Hall, 1989. 242 p.
3. Everit B. A Handbook of Statistical Analyses using S-PLUS. Chapman & Hall, 1994. 143 p.
4. Granger C.W.J., Newbold P. Forecasting Economic Time Series, 2nd ed. Academic Press, Inc., 1986. - 338 p.
5. Hackathorn D. Reinventing Enterprise Systems Via Data Warehousing. Washington, DC: The Data Warehousing Institute Annual Conference, 1995
6. Inmon W.H.Building The Data Warehouse (Second Edition). NY,NY: Wiley John, 1993
7. Kolmogoroff A. Sur Г interpolation et l'extrapolation des suites sta-tionaires. Compt. Rend., 208 (1939), p.2043
8. Mosteller F., Tukey J. W. Data Analysis and Regression: A Second
9. Course in Statistics. Reading, MA: Addison-Wesley, 1977.
10. Neter J., Wasserman W., Whitmore G.A. Applied Statistics, Allyn and Bacon, Inc., 1988. 1006 p.
11. Software Digest Rating Report. 1991, v. 8, № 5.
12. Spector P. An introduction to S and S-PLUS. Duxbuiy Press, 1994. -286 p.
13. Venables M.N., Ripley B.D. Modern Applied Statistics with S-PLUS. Springer-Verlag, 1994 462 p.
14. Winner N. Extrapolation, Interpolation and Smoothing of Stationary Time Series. John Wiley, New York, 1949.
15. Wold H.O. A Study in the Analysis of Stationary Time Series. Alm-quist and Wieksell, Uppsala, 1932
16. Айвазян С.А., Бухштабер B.M., Енюков И.С., Мешалкин JI.Д. Прикладная статистика; Классификация и снижение размерности. Справочное издание под ред. Айвазяна С.А. М.: Финансы и статистика, 1989. - 607 с.
17. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. Справочное издание под ред. Айвазяна С.А. -М.: Финансы и статистика, 1985.-471 с.
18. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. Справочное издание под ред. Айвазяна С.А. — М.: Финансы и статистика, 1983.-471 с.
19. Айвазян С.А., Мхитарян B.C. Прикладная статистика. Основы эконометрики. Учебник для вузов: В 2 т. 2-е изд., испр. — М.: "ЮНИТИ-ДАНА", 2001. 656 (1 том) и 432 (2 том) с.
20. Айвазян С.А., Степанов B.C. Инструменты статистического анализа данных// Мир ПК, № 8, 1997 http://www.osp.ru/pcworld/1997/08/34.htm
21. Андерсен Т. Введение в многомерный статистический анализ. —161
22. М.: Физматгиз, 1963. 500 с.
23. Андерсен Т. Статистический анализ временных рядов. М.: Мир, 1976.-756 с
24. Андрейчиков А.В., Андрейчикова О.Н. Анализ, синтез, планирование решений в экономике. М.: Финансы и статистика, 2000.-368 слил.
25. Арене X., Лейтер Ю. Многомерный дисперсионный анализ -М.: Финансы и статистика, 1985. — 230 с.
26. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов: Учебник М.: Финансы и статистика, 2001. — 228 с.
27. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. - 488 с.
28. Баласанов Ю.Г., Дойников А.Н., Королев М.Ф., Юровский А.Ю. Прикладной анализ временных рядов с программой ЭВ-РИСТА. Центр СП «Диалог» МГУ, 1991.-328 с.
29. Бард И. Нелинейное оценивание параметров. — М.: Финансы и статистика, 1979. 349 с.
30. Белов В.В., Васильев С.В., Наумкина С.Г. Модифицированный метод группового учета аргументов на основе процедуры оптимизации частных полиномов // Вычислительные машины, комплексы и сети: Межвуз. сб. науч. трудов. Рязань: РГРТА, 1999. С. 95-99.
31. Белов В.В., Горелов А.А. Аппроксимация процессов решениями линейных дифференциальных уравнений. // Межвузовский сборник научных трудов: Математическое и программное обеспечение вычислительных систем. Рязань: РГРТА, 2002. С. 90-94.
32. Белов В.В., Горелов А.А. Выбор вида регрессионной модели. // Межвузовский сборник научных трудов: Математическое и программное обеспечение вычислительных систем, Рязань:1. РГРТА, 2002. С. 94-98.
33. Белов. В.В. Алгоритмические методы повышения верности информации в распределенных информационно-управляющих системах.: М.: Радио и связь, 1999. - 238 с.
34. Белов. В.В., Чистякова В.И. Прогнозирование показателей социально-трудовой сферы на основе сценарных условий // Вестник РГРТА. Вып. 12. Рязань, 2003. С. 93-101.
35. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. — М.: Мир, 1989.-540 с.
36. Бендат Дж., Пирсол А. Применение корреляционного и спектрального анализа. М.: Мир, 1979. - 311 с.46.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.