Разработка систем поддержки принятия решений для слабоструктурированных задач классификации многомерных объектов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Пелипенко Екатерина Юрьевна

  • Пелипенко Екатерина Юрьевна
  • кандидат науккандидат наук
  • 2016, ФГБОУ ВО «Кубанский государственный технологический университет»
  • Специальность ВАК РФ05.13.01
  • Количество страниц 164
Пелипенко Екатерина Юрьевна. Разработка систем поддержки принятия решений для слабоструктурированных задач классификации многомерных объектов: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). ФГБОУ ВО «Кубанский государственный технологический университет». 2016. 164 с.

Оглавление диссертации кандидат наук Пелипенко Екатерина Юрьевна

ВВЕДЕНИЕ

1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

1.1 Классификационные системы поддержки принятия решений (СППР)

1.2 Методы и модели классификации многомерных объектов

1.3 Структурированность проблемы классификации объектов

1.4 Выводы

2 ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ СИСТЕМНОГО АНАЛИЗА В ПОСТРОЕНИИ КЛАССИФИКАЦИОННЫХ СППР

2.1 Формулирование целей в решении слабоструктурированных задач классификации

2.2 Анализ и синтез в классификации объектов

2.3 Этапы реализации СППР

2.4 Выводы

3 МЕТОДИКА ПОСТРОЕНИЯ КЛАССИФИКАЦИОННЫХ СППР

3.1 Построение обучающей эталонной выборки

3.2 Методы классификационного анализа

3.3 Методика ранжирования многомерных объектов и выбор итогового класса

3.4 Программная реализация классификационной СППР

3.5 Выводы

4 РАЗРАБОТКА СППР ДЛЯ КЛАССИФИКАЦИИ ПРЕДПРИЯТИЙ МАЛОГО И СРЕДНЕГО БИЗНЕСА

4.1 Моделирование обучающей выборки

4.2 Применение методов классификационного анализа

4.3 Математические модели оценки финансовых возможностей предприятий

4.4 Пример практического использования СППР

4.5 Выводы

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ А. Формы бухгалтерской отчетности

ПРИЛОЖЕНИЕ Б. Свидетельства о регистрации программ

ПРИЛОЖЕНИЕ В. Акты внедрения разработанных программных продуктов

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка систем поддержки принятия решений для слабоструктурированных задач классификации многомерных объектов»

ВВЕДЕНИЕ

Актуальность работы. Во многих сферах деятельности человека возникают проблемы классификации многомерных объектов, т.е. объектов, описываемых совокупностью количественных и качественных показателей (признаков). Определение группы однородности, к которой следует отнести конкретный объект, в зависимости от значений, принимаемых характеризующими его показателями, является важной задачей, без решения которой невозможно принятие эффективных управленческих решений.

Задачи классификации относятся к слабоструктурированным проблемам, решение которых осуществляется посредством совмещения знаний лица принимающего решения и возможностей компьютера. В связи с чрезвычайной трудоемкостью вычислительных процедур длительное время решение практических задач классификации даже небольшой размерности было связано с большими временными затратами. Статистические пакеты прикладных программ существенно расширили возможности практического применения математических моделей для решения задач классификации. Они открыли новые перспективы в классификации объектов различной природы на основании закономерностей, выявленных в эмпирических данных практически неограниченного объема.

С другой стороны при использовании методов классификации с обучением -дискриминантного анализа, деревьев классификации, нейронных сетей, логистической регрессии появляются определенные трудности, влияющие на решение задачи:

- обучающие выборки, представляющие собою реальные эмпирические данные, не удовлетворяют требованиям применимости методов (небольшие объемы, несоответствие распределения показателей нормальному закону, наличие выбросов - нетипичных значений, большие разбросы показателей и т.д.);

- неоднозначен выбор наиболее информативной системы показателей, определяющей принадлежность объектов к группам классификации;

- достаточно трудоемка классификация объектов по совокупности построенных математических и нейросетевых моделей;

Преодолеть указанные трудности можно при помощи систем поддержки принятия решений, позволяющих автоматизировать наиболее трудоемкие процедуры классификации в конкретной прикладной области человеческой деятельности.

Поэтому актуальным является создание классификационных систем поддержки принятия решений (СППР), как результата интеграции компьютерных средств обработки, анализа и хранения данных.

Степень разработанности проблемы. Интерес к изучению задач классификации многомерных объектов нашел свое отражение в многочисленных исследованиях российских и зарубежных авторов: Н.И. Куренкова, С.Н. Ананьева, С.А. Айвазяна, З.И. Бежаевой, О.В. Староверова, Р.Н. Каримова, Т. Кохонена, Г. Дебока, М. Дж. Кендалла, А. Стьюарта и др.

В настоящее время известно много работ отечественных ученых в области разработки систем поддержки принятия решений: Уринцова А.И., Дика В.В., Орлова А.И., Симанкова В.С., Смирнова Э.А., Ларичева О. И., Петровского А. Б., Терелянского, П. В. и зарубежных специалистов Паркинсона С.Н, Кина П., Тейлора Дж., Пауера Д., Маракаса Г. и др.

Работа выполнена в соответствии с паспортом специальности ВАК при Минобрнауки РФ (технические науки, специальность 05.13.01 - Системный анализ, управление и обработка информации):

- п.4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации»;

- п.5 «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации»;

- п.11 «Методы и алгоритмы прогнозирования и оценки эффективности, качества и надежности сложных систем»;

- п. 12 «Визуализация, трансформация, и анализ информации на основе компьютерных методов обработки информации».

Объектом исследования является система поддержки принятия решений для классификации многомерных объектов произвольной природы.

Предметом исследования выступает совокупность методов и алгоритмов классификации многомерных объектов.

Целью исследования является разработка методики построения СППР для слабоструктурированных задач классификации многомерных объектов.

Задачи исследования:

- осуществить систематизацию методов классификации многомерных объектов, исследовать проблему классификации с позиций системного анализа;

- построить СППР для задач классификации многомерных объектов на основе системного подхода;

- разработать блок-схему алгоритма СППР;

- предложить методику ранжирования многомерных объектов.

- как пример, построить СППР для экспресс-анализа финансового состояния предприятий малого и среднего бизнеса.

Методы исследования. Для решения поставленных задач были использованы методы системного анализа, экспертных оценок, лингвистической классификации, многомерного классификационного анализа, нейронных сетей, математического моделирования, методы решения разностных уравнений и разработки программного обеспечения.

Научная новизна. Как итог проведенного в работе системного исследования достигнуты следующие новые научные результаты:

1. Впервые предложена систематизация методов классификации многомерных объектов по трем основным признакам - по целевому временному интервалу, по типу используемых методик и по характеру используемой информации;

2. Построена оригинальная схема решения задач классификации на основе системного подхода и выделенных основных этапов системного анализа при создании СППР для слабоструктурированных задач классификации.

3. Впервые предложена методика создания СППР для классификации многомерных объектов, разработан алгоритм классификационной СППР, предложена методика ранжирования объектов, описываемых системой количественных показателей;

4. Разработана новая методика расчета индивидуальных и среднерыночных значений параметров кредитования предприятий малого или среднего бизнеса (МСБ).

Практическая значимость. Результаты научного исследования могут быть использованы при построении СППР для решения задач классификации объектов произвольной природы.

Разработанная методика построения СППР позволит формализовать:

- процедуру выбора наиболее информативной системы показателей, определяющих принадлежность объектов к группам классификации (классам);

- построение модельной обучающей выборки, удовлетворяющей условиям применимости методов классификации;

- выбор итогового класса принадлежности объекта в случае несогласованности результатов классификации.

СППР для экспресс-анализа финансового состояния предприятий МСБ обеспечит их достоверную классификацию по группам риска кризисного финансового состояния, позволит снизить риски кредитования, определить оптимальную сумму и процентную ставку выдаваемых кредитной или инвестиционной организацией денежных средств.

Реализация и внедрение работы. Диссертационная работа выполнена по программе стратегического развития Кубанского государственного университета в рамках проекта «Интеллектуальная информационная система поддержки принятия решений в сфере оценки финансового состояния предприятий малого и среднего бизнеса», регистрационный номер12/13с-1.3.

Разработанная СППР размещена на сайте statlab.kubsu.ru, результаты научного исследования внедрены в учебный процесс факультета прикладной математики КубГУ, в рабочий процесс консалтинговой компании ООО «Велбод» и инвестиционной компании ООО «Инвестфинанс Юг», о чем свидетельствуют акты о внедрении.

Апробация результатов диссертации. Основные положения диссертации докладывались на конференциях: VI Всероссийская открытая научно-практическая конференция «Актуальные задачи математического моделирования и информационных технологий», г.Сочи, 2010; III Международная научно-практическая конференция «Современные тенденции в экономике и управлении: новый взгляд», г.Новосибирск, 2010; IV Международная научно-практическая конференция «Наука и современность», г.Новосибирск, 2010; XIV Международная научно-практическая конференция «Актуальные вопросы экономических наук», г.Новосибирск, 2010; II Международная научная заочная конференция «Актуальные вопросы современной экономической науки», г.Липецк, 2010; VI Международная научно-практическая конференция студентов и молодых ученых «Молодые экономисты - будущему России», г.Ставрополь, 2014; Научно-технический семинар Института компьютерных систем и информационной безопасности КубГТУ, г.Краснодар, 2016.

Основные положения, выносимые на защиту. На защиту диссертации выносятся следующие положения:

1. Методика создания СППР и алгоритм СППР для классификации многомерных объектов, построенные на основе предложенной систематизации методов классификации и схемы решения задач классификации;

2. Методика ранжирования объектов произвольной природы как точек многомерного метрического пространства;

3. Методика расчета индивидуальных параметров кредитования МСБ при пакетном, индивидуальном подходе и в процессе становления долгосрочного равновесия.

Достоверность и обоснованность научных положений подтверждается использованием системного подхода и математического аппарата к решению задач научного исследования; применением признанных научным сообществом литературных источников предметной области решаемой задачи; построением адекватных математических моделей; согласованностью проведенных научных исследований с практическим опытом и известными знаниями предметной области; апробацией и результатами внедрения классификационной СППР.

Публикация результатов работы. По теме диссертационной работы опубликовано 13 печатных работ, в том числе 7 в изданиях, рекомендованных ВАК РФ для публикации основных результатов диссертации. Получены свидетельства о регистрации 4 программ для ЭВМ.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, выводов по каждой главе, заключения, списка используемой литературы и приложений. Диссертация изложена на 120 листах основного текста, содержит 22 рисунка и 17 таблиц. Список используемой литературы содержит 218 наименований.

1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

1.1 Классификационные системы поддержки принятия решений (СППР)

Современный этап развития общества характеризуется тотальным использованием информационных систем в различных областях деятельности человека. Создание таких систем направлено на повышение эффективности принимаемых управленческих решений. Особую актуальность приобрели системы поддержки принятия решений (СППР) для классификации объектов произвольной природы. В настоящее время их успешно используют в различных областях человеческой деятельности - в экономике, финансовой деятельности, здравоохранении, социальной сфере, государственном управлении и др.

Появление информационных систем в российской экономике берет свое начало в 1991 - 1992 гг., когда на рынке стали разрабатываться первые программы для автоматизации бухгалтерского учета для хранения и обработки данных, предназначенные для юридических лиц [1]. Следующим этапом стало появление экспертных систем, применяемых при исследовании сложных систем, в процессе рассмотрения которых возникают проблемы, выходящие за рамки математических постановок задач. В таких исследованиях прибегают к помощи экспертов, т.е. лиц, чьи суждения и интуиция могут уменьшить сложность проблемы. Первые экспертные системы в экономике России появились в начале 2000 гг. Одной из первых (2001 г.) была автоматизированная система поддержки принятия решений «Форель 1.0.» компании ФОРЕКСИС [2], разработанная по заказу РАО ЕЭС России для расчета и предоставления пользователям оперативного краткосрочного (до 7 дней) прогноза почасовых текущих рыночных (спотовых) цен на электроэнергию на энергетической бирже NordPool в ценовой зоне Finland. Первой экспертной системой, появившейся в российском банковском секторе в 2004 году, стала пилотная разработка «Forecsys Scoring Pilot» [3], созданная по заказу банка Петрокоммерц и предназначенная для

обеспечения поэтапного построения скоринговой модели в условиях начального накопления экспертного опыта и прецедентных данных. Продолжением данного проекта является система поддержки принятия кредитных решений «Forecsys Scoring Solution (Credit4Cast)», разработанная в 2009 г.

В настоящее время на рынке программного обеспечения для финансового сектора присутствует множество фирм-разработчиков. Ни одна компания из десятки лидеров [4] не разрабатывает экспертные системы или СППР. Только компания PROGNOZ, занимая 20 позицию, предлагает разработки классификационных систем поддержки принятия решений (СППР) для анализа финансового состояния контрагентов [5].

Мировым лидером в создании зарубежных информационных систем в финансовом секторе для решения задач классификации является компания Fair Isaac Corporation (FICO). Первая классификационная модель от этой компании, разработанная инженером Биллом Фэйром и математиком Эрлом Айзеком в 1956 г., была предназначена для определения кредитоспособности клиентов (физических лиц) банков и покупателей универмагов [6]. А осенью 2008 появилась их новая разработка - FICO 08 [7]. На российском рынке информационные системы от компании FICO стали пользоваться популярностью после их адаптации к особенностям этого рынка. Первой информационной системой, ориентированной на российские банки, стала «FICO® Score» от НБКИ (Национальное бюро кредитных систорий), разработанная в том же году. В 2010 г. было принято решение о запуске второго поколения системы «FICO® Score 2» [8]. Ее основной особенностью стала способность конвертировать большие объемы данных кредитных историй в некий балл оценки кредитного рейтинга по шкале от 300 до 850, который определяет уровень вероятности дефолта заемщика. По результатам набранных баллов системой автоматически принимается решение об одобрении или отказе в выдаче кредита. Наряду с «FICO® Score 2» была также успешно запущена система «FICO®(Expansion)», ориентированная в основном на банки средних размеров, которые не имеют возможности инвестировать капитал в развитие информационных технологий в том же объеме,

что и крупные банки. В начале 2013 г. компания НБКИ объявила о появлении в России классификационной системы «FICO Application Fraud score» для оценки возможных обманных действий потенциальных заемщиков сектора розничного кредитования [9]. Система позволяет отслеживать заявки на кредит, для которых характерен высокий риск мошенничества. Особенностью информационной системы (ИС) компании FICO является скрытость применяемых моделей скоринга.

Несмотря на длительное лидерство на рынке кредитования физических лиц, компания FICO не занимается разработкой ИС для анализа финансового состояния субъектов малого и среднего бизнеса (МСБ). На российском рынке данная ниша остается еще не занятой - явных признанных лидеров в создании классификационных СППР для МСБ в России еще нет. Можно выделить несколько фирм, осуществляющих попытки занять долю рынка информационных технологий в кредитовании юридических лиц. Самыми яркими представителями являются: программный комплекс «Прогноз. Кредитный риск» и «Прогноз. Кредитный риск - IRB» компании PROGNOZ, система управления кредитными рисками «Credit Compass» консалтинговой компании Франклинг&Грант Риск консалтинг, а также система поддержки принятия решений Credit4Cast (Forecsys Scoring Solution) компании Forecsys. Программные продукты компании PROGNOZ, в своем большинстве, ориентированы на менеджмент кредитной организации, но некоторые из них, например, «Прогноз. Кредитный риск» и «Прогноз. Управление кредитным портфелем» включают модуль классификации заемщиков согласно их финансовому состоянию - получателей кредитных средств, поручителей, гарантов, а также иных сторон кредитных сделок и оценки кредитного риска сделок [5]. Основным недостатком ИС компании PROGNOZ является их высокая стоимость и сложность в использовании, что зачастую вызывает отторжение сотрудниками кредитных организаций.

Программные решения для банков компании «Франклинг&Грант. Риск консалтинг» включают разработку и внедрение классификационных систем по оценке кредитоспособности юридических лиц, систем скоринга физических лиц,

систем управления капиталом на всех уровнях работы банка. Разрабатываемые продукты основаны на составлении скоринговых карт [10], позволяющие оценить характеристики заемщика в баллах. Система Credit Compass ориентирована на управление кредитным портфелем банка и, в качестве классификационного модуля включает модели скоринга финансового состояния юридических лиц. Модели, работающие на транзакционном уровне, дают возможность классификации заемщика на различных этапах кредитования (аппликативный и поведенческий скоринг - на основе анализа кредитной истории) [11]. Преимуществом системы Credit Compass является ее реализация с использованием технологии программирования - Microsoft.NET. Для работы с системой не требуется ничего, кроме стандартной, для любой Windows или Unix машины, программы Интернет браузера (Mozilla Firefox, Microsoft Internet Explorer, Chrome). Недостатками ИС «Credit Compass» является ее сложность и неудобство в использовании.

Решение «Credit4Cast» [12] компании Forecsys является классификационной системой поддержки принятия решений на различных этапах управления кредитными рисками. Она разработана на основе методов data mining (деревья решений, поиск логических правил и т. д.) и идей компании Forecsys: анализ клиентских сред, основанный на поведении клиентов; прогнозирование взаимосвязных процессов во времени на основе алгебраического подхода к построению алгоритмических композиций. Credit4Cast полностью автоматизирует процесс загрузки, обработки и построения классификационных моделей, снижая операционные затраты и освобождая специалистов от рутинных задач, сосредоточив их усилия на особых случаях, которые невозможно учесть при автоматическом прогнозировании. Система направлена на создание скоринговых моделей с использованием ситуационных и макроэкономических показателей. Ее преимуществом является легкость в управлении, простота интерфейса. Система прошла проверку на практике: с июня 2005 по конец 2007 гг. проходила тестовые испытания анализа финансового состояния клиентов банка «Петрокоммерц». Несмотря на быструю интеграцию ИС Credit4Cast, банки вынуждены выделять

значительные средства для поддержки функционирования системы, что является финансово накладным для кредитных организаций среднего размера. Кроме того, оценка эффективности работы системы была дана за период, когда экономическая ситуация в стране была достаточно стабильной. В настоящее же время нестабильность внешней и внутренней экономики ставит под вопрос использование технологии прогнозирования взаимосвязных процессов системы Credit4Cast, в основе которой лежит анализ временных рядов.

В настоящее время мировой рынок программного обеспечения содержит множество классификационных СППР для коммерческих организаций и инвестиционных компаний, построенных на базе статистических пакетов. По их числу лидерами рынка являются Американские компании, самыми крупными представителями которых стали SAP, IBM, SAS, Microsoft и другие. К их наиболее известным разработкам относятся: IBM ILOG Optimization and Analytical Decision Support Solutions (Bank of America), Microsoft Dynamics CRM (MidAtltantic Farm Credit, Southcoast Community Bank, Sterling Bank и другие), Misys Risk Vision компании Misys (Crédit Agricole CIB [13], Noor Islamic Bank [14] и другие крупные банки и инвестиционные компании мира), Bank Analyzer 7.0 Credit Risk компании SAP (Commonwealth Bank of Australia, First Tennessee Bank [15]) , SAS Credit Risk management for banking (Bank of America, China CITIC Bank, CIMB bank, Dexia bank, EON Bank Group, Laurentian Bank, Majit Al Futtime Finance, OKO Bank, Piraeus Bunk Groop, Pitney Bowes, Toikoku Databank, Zagrebacka banka, Zürcher Kantonalbank [16] ).

Массовая тенденция к использованию американскими кредитными организациями классификационных СППР появилась с 2000 гг. Сначала банки использовали системы, основанные на логит-регрессии и дискриминантном анализе, например, разработки Credit Risk Tricer Северная Америка [17] или продукция компании SPSS [18, 19]. Подробное описание математических методов, используемых в начале 2000 гг. для скоринговых моделей представлено в [20]. В современных программных продуктах фирм-разработчиков классификационные модели базируются на классических статистических методах

многомерного анализа, на нейросетевых и генетических алгоритмах, на теории нечетких множеств, технологиях data mining [21] , [22]. Например, решения компании SAS для банковского сектора - Credit Scoring for Banking (США) [23], основаны на методах описательного моделирования, data mining, прогнозировании, оптимизации, симуляции, постановки эксперимента, выявление закономерностей и аномалий, на нейросетевых и генетических алгоритмах [24]. В основу разработок легла интеграция их собственного пакета прикладных программ статистической обработки данных с системой управления базами данных и другими модульными приложениями.

Использование в банковском кредитовании классификационных СППР на основе новых статистических методов так же развито и в Китае. В работе [25] подробно изложены используемые в крупнейших китайских банках математические методы скоринга. Анализ моделей проводился по данным четырех крупнейших банков Китая, на долю которых приходится 85% финансовых операций страны: Bank of China (BOC), Industry and Commerce Bank of China (ICBC), Agriculture Bank of China. Используемые ими информационные системы основаны на БД, data mining, нейронных сетях и генетических алгоритмах, OLTP или OLAP методах.

Во Франции разработкой классификационных СППР на основе скоринговых моделей занималась компания ILOG, которая в 2009 г. была полностью поглощена американской компанией IBM. Все разработки компании ILOG были сохранены и стали выпускаться под брендом IBM ILOG.

В крупных Европейских банках [26] используют в основном продукты ведущих американских фирм-разработчиков [27]. Широкая география научных публикаций - Тайвань [28], Сингапур [29] Италия [30], [31], Турция [32], Египет [33], Бразилия [34], Бельгия [35], Иран [36] и др., показывают, что в странах мира стали появляться самостоятельные разработки на основе современных скоринговых моделей, направленные на поддержку принятия решений при оценки финансового состояния экономического субъекта.

В здравоохранении задачи классификации встречаются наиболее часто. Например, постановка диагноза на основе анализа данных о состоянии пациента или идентификация стадии заболевания [37]. В настоящее время создано достаточно много медицинских систем поддержки принятия решений для задач классификации. Подробное описание существующих медицинских классификационных СППР представлено в работах [38, 39, 40].

Медицинские системы обработки информации и экспертного анализа позволяют на основе информации о клинических проявлениях и тестов сделать в короткий срок квалифицированное заключение по каждому конкретному случаю относительно диагноза, или тяжести заболевания и выработать оптимальную стратегию лечения больного [41]. Вот несколько примеров медицинских информационных систем (МИС), основанных на классификации состояния пациента по типам и стадиям заболеваний:

Система «.Archimedes IndiGO» [42] является разработкой Американской компании Archimedes inc. Система предназначена для врачей, медицинских работников и пациентов. На основе данных о состоянии клиента Archimedes IndiGO позволяет прогнозировать риск сердечного приступа, диабетического криза и других заболеваний. В функцию системы входят рекомендации по подбору медицинских препаратов, способствующих снижению рисков этих заболеваний. Система «Autonomy Healthcare» [43] была разработана в Кембриджском университете в Великобритании. В настоящее время право собственности на систему принадлежит компании Hewlett-Packard. Система анализирует историю болезни пациента, его симптомы и опыт врача, а затем проводит анализ всех имеющихся данных и предлагает врачу список возможных диагнозов пациента [44]. Американская система «DXplain» [45] была разработана в Бостоне в 1986, но используется до сих пор. Её работа основана на извлечении знаний из базы данных посредствам анализа симптомов, лабораторных данных и процедур. На основе наблюдений врача и результатов обследований система обеспечивает поддержку и обоснование дифферециальных диагнозов и последующих исследований [46]. Система «Apache III» (Acute Physiology and

Chronic Health Evaluation) позволяет прогнозировать тяжесть заболевания пациента и оценить состояние всех его важнейших физиологических систем. Работа «Apache III» основана на оценке состояния пациента по одноименной шкале, разработанной американским ученым Knaus W. A. в 1991 году на основе данных более, чем 40 госпиталей США.

Система «Germwatcher» [47] была разработана в помощь больничному эпидемиологу. Генерация гипотез о возможных заболеваниях пациента основывается на базе знаний, содержащей большой объем данных по различным микробиологическим культурам. Система «SETH» [48] предназначена для анализа токсичности лекарственных средств. В ее основе лежит моделирование экспертных суждений, основанных на клинических симптомах и применяемых дозах для каждого токсикологичекого класса. Системы «CaDet» и «Kasimir» разработаны для лечения онкологических заболеваний. В отличие от системы «Kasimir», система «CaDet» позволяет врачу не только ставить диагноз, но и прогнозировать развитие болезни. Работа американской системы «HELP» [49] направлена на поддержку принятия решений медицинским персоналом с целью улучшения медицинского обслуживания. Работа системы основана на базе знаний и технологиях искусственного интеллекта.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Пелипенко Екатерина Юрьевна, 2016 год

т - И

г = И +1, т

3.4 Программная реализация классификационной СППР

На рисунке 3.2 представлена IDEF0-диаграмма этапов программной реализации классификационной СППР. Они включают моделирование обучающей эталонной выборки многомерных объектов на основе выбранной системы показателей и реальных данных об объектах; создание базы данных объектов, которая расширяет возможности по хранению, обработке и предоставлению данных; разработку информационной оболочки СППР с возможностью доступа через сеть Интернет; интеграцию модулей классификационного анализа и созданной оболочки СППР, а так же тестирование всей системы.

Этап моделирования обучающей эталонной выборки многомерных объектов заключается в реализации методики, подробное описание которой было представлено в §3.1. Методика включает выбор полной и не избыточной системы количественных показателей, характеризующей объект по выбранному качественному признаку. В соответствии с законом распределения каждого показателя и значением его параметров, полученных на основе выборочной совокупности реальных данных, генерируется множество эталонных значений показателей для каждого класса. Сгенерированным данным назначается класс в соответствии со стандартным нечетким 01- классификатором, уровни которого соотносятся с обозначенными группами однородности. Группировка значений показателей в п-мерные эталонные объекты позволяет создать модельную выборку, которая является прообразом реальных данных, но лишена их недостатков.

Этап проектирования базы данных многомерных объектов включает концептуальное (инфологическое), логическое (деталогическое) и физическое проектирование.

Программист-разработчик, эксперт, системный аналитик, проектировщик

Рисунок 3.2 - IDEF0-диаграмма этапов программной реализации классификационной СППР

На этапе концептуального проектирования создается семантическая модель предметной области, которая описывает ее понятия, связи между ними и ограничения целостности. На этапе логического проектирования строится схема базы данных на основе модели данных, проектируются сущности, атрибуты и связи между сущностями, отношения модели преобразуются к виду согласно нормальным формам. Нормализация сущностей модели данных обеспечивает минимальную логическую избыточность, позволяет устранить недостатки структуры, которые приводят к ошибкам в процессе эксплуатации базы и нарушениям целостности данных. Физическое проектирование состоит в построении базы данных для конкретной выбранной системы управления базами данных с ориентацией на ее специфику (например, ограничения на типы данных, наименования сущностей и др.).

Информационная оболочка СППР является web-приложением. Такой подход имеет ряд преимуществ. К ним относятся возможность доступа к системе из любой точки земного шара; экономия денежных средств на приобретении, сопровождении и модернизации программного обеспечения; независимость от вычислительной мощности точки доступа; расширение вычислительных возможностей системы. К недостаткам такой организации доступа к разрабатываемой СППР относятся понижение уровня сохранности конфиденциальных данных и постоянная необходимость в высокоскоростном доступе в Интернет. Так как вопрос безопасности и конфиденциальности данных в некоторых случаях имеет первостепенную важность, то одним из путей его решения является использование облачных технологий, а именно, развертывание частного облака и управление СППР без привлечения сторонней организации. Такой подход к сохранности данных надежен, но дорогостоящ. Поэтому использование частного облака могут позволить себе только крупные организации, вопрос конфиденциальности данных для которых, в силу специфики их работы, является существенным.

Интеграция моделей классификационного анализа многомерного объекта в информационную оболочку СППР позволит наполнить систему

функциональностью, их включение в оболочку системы возможно двумя способами: посредствам импорта-экспорта данных или посредствам реализации моделей на соответствующем языке web-программирования. Первый способ обеспечивает оперативное перестроение моделей за счет использования статистических пакетов. Второй - сокращение времени ожидания результата классификации системой и повышение надежности работы системы.

Тестирование системы состоит в наблюдениях и экспериментах над построенной программой, в проверке адекватности использованных моделей классификации. Данный этап позволит определиться с выбором альтернатив решения поставленной задачи. На данном этапе возможно выявление ошибок, допущенных при разработке и программной реализации СППР.

После устранения ошибок, результатом этапа тестирования будет пилотная (пробная) версия СППР. За тестированием следует опытная эксплуатация продукта, где эксперты и специалисты могут внести свои дополнения, пожелания и замечания в работу системы. На их основе осуществляется дальнейшая технологическая и программная доработка СППР. Результатом этапа опытной эксплуатации и доработки программного продукта станет окончательная версия СППР.

Ниже представлена блок-схема алгоритма классификационной СППР, которая включает четыре подсистемы (рисунок 3.3): работы с данными (I); формирования системы показателей (II); многомерного классификационного анализа (III), выбора итогового результата классификации (IV).

Подсистема работы с данными предназначена для хранения, обработки и представления информации о многомерных объектах в базе данных, которая позволяет структурировать, систематизировать и организовывать данные. Подсистема с помощью SQL запросов обеспечивает возможность СППР внесения, удаления и поиска данных об объекте. Использование встроенной в оболочку СППР базы данных позволяет наполнить систему функциональностью, а также обеспечить возможность расширение функциональности в случае необходимости.

Рисунок 3.3 - Блок-схема алгоритма СППР

Подсистема формирования показателей предназначена для анализа корректности данных. Для каждого показателя рассчитываются пороговые значения, при выходе за которые генерируется сообщение о возможной ошибке или

фальсификации данных. Система предусматривает два источника формирования значений показателей: база данных объектов и диалоговое окно ввода данных пользователем. Первый - удобен в случае неоднократного обращения к данным, а второй - обеспечивает более высокую степень конфиденциальности данных. Выбор способа формирования системы показателей осуществляется пользователем СППР.

Подсистема классификационного анализа позволяет отнести объект к группе однородности согласно выбранным методам классификации, например, дискриминантному анализу, деревьям классификации, нейронным сетей, логит-регрессии и др. Описание некоторых методов классификации представлено в §3.2. Совокупность методов может быть расширена или изменена в соответствии с решаемой задачей. Например, не всякий многомерный объект может быть классифицирован по двум классам, поэтому применение метода логит-регрессии возможно только для некоторого круга задач. Одним из условий применимости параметрических методов дискриминантного анализа является соответствие распределения признаков объекта нормальному закону. Если показатели реальных объектов распределены в соответствии с другим законом распределения, то и показатели модельной базы, в силу технологии построения, будут так же иметь распределение отличное от нормального. Использование параметрических методов при этом некорректно и следует воспользоваться непараметрическим методом дискриминантного анализа, который не требуют знаний о точном функциональном виде распределений показателей и допускает использование показателей, измеренных в порядковой или номинальной шкале. Такие методы как деревья классификации и нейронные сети не имеют каких-либо строгих теоретических предположений, налагаемых на выборочные данные, и так же могут использовать качественные показатели. Следует отметить, что чем строже условия применимости метода, тем при их выполнении метод дает более качественную классификацию.

Если согласно различным методам классификации объект отнесен к одному и тому же классу, то решение относительно его принадлежности к классу

однозначно, в противном случае - следует воспользоваться предложенной методикой ранжирования многомерных объектов (см. §3.3).

3.5 Выводы

В третьей главе получены следующие результаты:

1. На основе рассмотрения многомерного объекта, как системы предложен способ выбора системы показателей, наиболее полно характеризующих многомерный объект по выбранному качественному признаку;

2. Разработана методика построения модельной обучающей выборки как прообраза реальных данных, но лишенной их недостатков: малого объема, несоответствия закона распределения показателей нормальному закону, наличия выбросов;

3. Для случая разногласий в результатах классификационных методов анализа данных предложена методика ранжирования многомерных объектов, которая позволяет сделать выбор итогового класса принадлежности объекта;

4. Построена IDEF0-диаграмма основных этапов реализации классификационной СППР. Последовательность этапов диаграммы отражает предлагаемую методику создания СППР для слабоструктурированных задач классификации многомерных объектов;

5. Разработана блок-схема алгоритма классификационной СППР. Выявлены четыре подсистемы алгоритма: работы с данными; формирования системы показателей; многомерного классификационного анализа; выбора итогового результата классификации. Описана их функциональность.

4 РАЗРАБОТКА СППР ДЛЯ КЛАССИФИКАЦИИ ПРЕДПРИЯТИЙ МАЛОГО И СРЕДНЕГО БИЗНЕСА

В настоящее время проблема управления денежными потоками стоит достаточно остро. Основными факторами, влияющими на экономическое развитие страны, являются внутренняя и внешняя экономические ситуации. Пакеты санкций, введенные западными странами в отношении России, были направлены, в основном, на запрет ввоза продукции в страну. В связи с этим на рынке сбыта возросла потребность в импортозамещении, которую удовлетворить без поддержки малого и среднего бизнеса (МСБ) невозможно [138]. На экономические санкции, ослабление рубля и рост инфляции МСБ отреагировал значительно быстрее прочих секторов экономики. Кроме того, последние четыре года наблюдается, в основном, негативная тенденция развития МСБ - снижение качества роста сектора, падение финансовых показателей его деятельности. Основной возможностью поддержки этого сектора являются развитие инвестиционных проектов и кредитных продуктов для МСБ.

В то же время, конкуренция между финансовыми учреждениями приводит к снижению требований к представителям МСБ со стороны кредитных и инвестиционных организаций. Это в свою очередь увеличивает риски потерь денежных средств и, как следствие, требует использования более надежных научно обоснованных методик анализа финансового состояния предприятия МСБ. Задача оценки финансового состояния предприятия МСБ относится к слабоструктурированной проблеме классификации многомерного объекта, поэтому для ее решения использовали системный подход, теоретические аспекты которого были изложены во второй главе.

В работе [120] отмечается, что в зависимости от глобальной цели критерии формирования классов и выбора альтернатив могут отличаться. Глобальные цели кредитных и инвестиционных организаций отличаются: первые являются посредником между правительством и реальным сектором экономики, а вторые -независимы от политики государства, поэтому основная нагрузка на

финансирование МСБ ложится именно на кредитные институты. Весомость системы кредитования для развития МСБ и экономики страны в целом направила задачу создания классификационной СППР в русло оценки финансового состояния предприятия МСБ.

Рассматривая некоторый объект, как систему для решения выявленной проблемы, необходимо учесть, что эта система является лишь элементом некоторой надсистемы, а потому она не изолирована и не монолитна [148]. В разрезе проблемы классификации предприятия МСБ на основе его финансового состояния необходимо учитывать не только внешние условия развития малого и среднего бизнеса, а так же особенности системы кредитования МСБ в настоящий период времени.

Система кредитования направлена, в первую очередь, на финансовую поддержку развивающихся экономических единиц кредитуемой отрасли, способных в будущем усилить экономику страны [149]. Одной из проблем системы кредитования является выявление таких развивающихся единиц, так как неверное определение финансового состояния заемщика приводит либо к финансовым убыткам кредитных организаций, либо к будущим потерям в развитии отрасли.

Проблемы в системе кредитования возникают из-за недостаточности системных представлений в происходящих локальных и глобальных экономических процессах. Экономическая система представлена составляющими, которые постоянно взаимодействуют друг с другом и с внешней средой. Так, экологические катастрофы или существенные изменения в политике ведущих стран приводят к нарушению устойчивости экономики страны, в результате чего происходят изменения и в системе кредитования. Изменения в политике процентных ставок Центрального банка могут стимулировать предпринимательскую деятельность и инвестиционный процесс или тормозить их развитие.

Ведущим свойством любой системы является наличие в ней механизмов саморегуляции. В системе кредитования отклонение результата

функционирования, заставляет все элементы системы работать в сторону возвращения к оптимальному уровню. При этом формируется субъективный информационный сигнал на рынке кредитования - избыток иди дефицит денежных средств. Возвращение результата к равновесному уровню функционирования системы сопровождается равенством объемов спроса и предложения заемных денежных средств. Таким образом, экономика страны представляет собой саморегулирующуюся адаптивную систему, параметры объекта управления которой не остаются неизменными, а преобразуются при изменении внешних условий [150]. Одними из первых исследователей в выявлении механизмов саморегуляции на макроэкономическом уровне стали известный американский экономист, удостоенный в 1970 Нобелевской премии по экономике, Пол Самуэльсон [150, 151] и выдающийся российский экономист Н.Д. Кондратьев [152]. Процесс саморегуляции системы кредитования возможен только на основе возникшего дисбаланса в функционировании системы, который не может не отразиться на экономике страны. Чтобы выявить отклонения от нормы функционирования системы на раннем этапе, когда дисбаланс не привел к глобальным изменениям в экономике, необходим системный подход при исследовании, как всей системы кредитования, так и ее основных составляющих: кредитных организаций и заемщиков.

С одной стороны, сектор малого и среднего бизнеса является лидером по величине маржинальности, что в значительной мере является привлекательным для кредитных организаций в условиях постоянных кризисов и нестабильности экономической ситуации. В то же время, кредитование предприятий МСБ в условиях сильного влияния неблагоприятной внешнеэкономической и внешнеполитической конъюнктуры характеризуется ростом рисков невозврата заемных денежных средств. Причиной невозврата чаще всего становится неустойчивое финансовое состояние заемщика. Именно поэтому на данном этапе развития системы кредитования особую актуальность приобретает анализ финансового состояния представителей сектора МСБ.

В настоящее время действуют антикризисные программы поддержки банковского сектора в кредитовании МСБ - предоставление кредитов коммерческим банкам со стороны Центрального Банка и целевая программа Российского банка развития на финансирование МСБ. Многие региональные программы предусматривают предоставление кредитов для индивидуальных предпринимателей по ставкам, которые намного ниже среднерыночных [153]. Переход Центрального Банка России к таргетированию инфляции и невмешательству в курсообразование [154], разработка новых проектов [155] так же направлены на поддержку МСБ. Государство приняло меры, способствующие снижению рисков кредитных организаций при кредитовании [156] - регистрацию уведомлений о залоге в реестре движимого имущества.

Несмотря на все перечисленные меры, отмечена переориентация ведущих банков на финансирование крупных российских компаний [157, 158]. Основными ее причинами стало ухудшение финансового состояния предприятий МСБ. Ниже представлен график (рисунок 4.1), отражающий долю просроченной задолженности по кредитам МСБ.

10% 9% 8% 7% 6% 5% й% 3% 2% 1% 0%

^ 8,2% / —л. а,чт* 7,6%

6,9% 7.2% 7,4%

5,7%

■^5,2% 4,9%

.. в 4,0%

4,2% *—--■ _ ■

В 7% —---------■—

5,5% 3,3% 3,3% 3,5% 3,5%

го*

.«г

-г -г -г

о

О' О* О

Л4, гРЧ Л

о

.//У

о

о>

■Просроченная задолженность по кредитамФЛ, % ■Просроченная задолженность по кредитам МСБ, % Просроченная задолженность по кредитам крупному бизнесу, %

Рисунок 4.1 - Динамика просроченной задолженности в 2011 - 2014 гг.

По состоянию на 01.01.2015, уровень просроченной задолженности в сегменте МСБ достиг 7,7%. Несмотря на относительную стабилизацию, процент просроченных платежей в секторе малого и среднего предпринимательства превышает показатели задолженности по кредитам физических лиц и крупного бизнеса, что видно из рисунка.

По причине ненадежности существующих моделей оценки финансового состояния заемщика, кредитные организации стали отказываться от них. Чаще стал использоваться анализ финансового состояния заемщика вручную [159]. Конечно, это снизило риски за счет индивидуального подхода к каждому клиенту, но увеличилось число технических ошибок, связанных с человеческим фактором. Кроме того, стремясь сохранить объемы кредитования, кредитные организации увеличили число выдаваемых краткосрочных кредитов взамен долгосрочным. Это привело к значительному увеличению временных и физических трудозатрат на выдачу кредитов.

Рассматривая перспективы развития малого и среднего предпринимательства в России можно отметить, что экономическая стабилизация, несомненно, приведет к увеличению объемов кредитования малого и среднего бизнеса. Дело в том, что сегмент кредитования малого и среднего бизнеса обладает большим потенциалом. Рост числа предприятий МСБ способствует увеличению спроса на заемные денежные средства, кроме того, маржинальность малого и среднего предпринимательства выше, чем в сегменте кредитования крупных корпоративных клиентов [160]. Основным препятствием к увеличению портфеля МСБ является отсутствие эффективных методов оценки финансового состояния заемщиков и нестабильная экономическая ситуация в стране и за ее пределами.

4.1 Моделирование обучающей выборки

Построены модели состава и структуры заемщика, на примере предприятия МСБ, занимающегося производственно-торговой деятельностью. На рисунке 4.2 представлена модель состава предприятия МСБ в сфере торговли и производства.

Из модели видно, что система содержит большое количество составляющих, которые можно рассматривать, как множество разнородных относительно самостоятельных управляемых и взаимосвязанных элементов. Все элементы подчинены единой цели: получению финансовой прибыли от результата функционирования предприятия.

Модель состава предприятия включает пять блоков: экономический, правовой, производственный, сопровождающий и управленческий. Экономический блок представлен элементами системы, объединенными экономическими процессами и экономическими связями всех сторон производства [51, 161, 162, 163]. Правовой блок включает в себя всю юридическую документацию организации, подсистему ориентации деятельности и систему налогообложения [164, 165]. Производственный блок отражает все процессы, связанные с производством товара [166]. Сопровождающий блок включает в себя в качестве элементов поддерживающие бизнес-процессы, обеспечивающие функционирование бизнес-системы и сопровождающие создание продукта на всем протяжении его жизненного цикла [167]. Управленческий блок коммерческой организации представлен подсистемой руководства предприятия, процессами управления и стратегией компании [168, 169, 170].

Рисунок 4.2 - Модель состава предприятия МСБ

Модель состава представляет достаточно полную информацию о составе предприятия, но этой информации не достаточно для управления объектом. Для эффективного управления была построена структурная модель предприятия (рисунок 4.3), отражающая взаимосвязь между элементами модели состава.

Рисунок 4.3 - Структурная модель предприятия МСБ

Для упрощения изображения связей в модели каждому ее элементу присвоили номер, отраженный в верхнем углу соответствующего блока. Связь между элементами системы осуществляется за счет передачи каких-либо объектов между этими элементами - объектов связи. Элемент, откуда передается объект -исходным субъектом связи, а тот элемент, куда он передается - принимающим субъектом. На рисунке связи обозначены giJ■, где I - номер исходного субъекта, а у - принимающего. Они изображены в виде стрелок, выходящих из блока, соответствующего элементу i, в блок элемента у. Наряду с односторонними связями существуют двухсторонние, для которых одновременно исходный субъект является принимающим, а принимающий исходным. Большое количество связей позволило говорить о многосвязности элементов предприятия и о целостности всей системы.

Модель структуры отражает сложную взаимосвязь между элементами модели состава предприятия. Такая взаимосвязь позволила сделать вывод о сложности структуры заемщика, как объекта исследования.

Как было сказано выше, предприятие МСБ является элементом надсистемы кредитования, поэтому анализ взаимодействия исследуемого объекта с другими элементами надсистемы позволяет определить и учесть влияние изменений объекта на другие системы (рисунок 4.4).

Рисунок 4.4 - Структурная модель системы кредитования

Структура надсистемы не может быть рассмотрена независимо от ее функций. Поскольку выполняемые функции составляют процессы, то целесообразно дополнительно рассмотреть функционально-структурную модель системы кредитования. На рисунке 4.5 изображена IDEF0-диаграмма, которая описывает этапы процесса кредитования. Функционально-структурная модель отображает схему взаимодействий элементов. Заемщик для получения определенного кредита предоставляет кредитору всю запрашиваемую информацию. Анализ собранных данных о клиенте позволяет эксперту (кредитному аналитику) дать оценку финансовой и нефинансовой характеристики заемщика. На основе этих характеристик, с учетом оценки информации о внешней среде системы, аналитик принимает решение об одобрении или отказе в

выдаче кредита. Принятое решение может быть представлено как отказом в предоставлении займа, так и одобрением с определенными условиями получения кредита. В случае одобрения кредитор и заемщик вступает во взаимоотношения, которые юридически закрепляются подписанием кредитного договора. У каждой из сторон, согласно договору, появляются обязательства, у кредитора -предоставление займа на определенных условиях, а у заемщика - обязательства по выплатам заемных денежных средств с учетом процентной ставки. Получив денежные средства согласно кредитному договору заемщик, при добросовестном выполнении обязательств, приносит прибыль кредитной организации. Данные о кредите заносятся в кредитную историю заемщика, которая размещается в бюро кредитных историй (БКИ). Совокупность таких данных обеспечивает возможность развития, усовершенствования и наращивания возможностей системы кредитования.

Рисунок 4.5 - IDEF0-диаграмма этапов процесса кредитования

IDEF0-диаграмма позволила глубже понять процедуру кредитования, важность всех этапов, в частности этапа принятия решений о выдаче кредита, и

разработать систему поддержки принятия решений (СППР) для экспресс-анализа финансового состояния предприятий МСБ.

Бухгалтерская отчетность отражает экономическую деятельность, которая является определяющим фактором в вопросе о финансовом состоянии заемщика. Вычисленные на ее основе показатели, позволяют провести экспресс-анализ финансовой устойчивости заемщика. Для решения задачи классификации предприятия МСБ согласно его финансовому состоянию выбирали систему финансовых коэффициентов, наиболее полно отражающих структуру и функцию объекта исследования. Для этого были рассмотрены 28 показателей 4 групп, характеризующих финансовую деятельность предприятия с разных сторон: коэффициенты рентабельности R1, R2, R3, R4, R5, R6; коэффициенты ликвидности и платежеспособности - L1, L2, L3, Р1, Р2; коэффициенты деловой активности - А1, А2, А3, А4, А5, А6; коэффициенты финансовой устойчивости - F1, F2, F3, F4, F5, F6, F1, F8, F9, F10, F11 . Формулы для расчета коэффициентов [171, 172, 173, 174, 175] основаны на данных бухгалтерской отчетности по форме №1 - «Бухгалтерский баланс» и форме №2 - «Отчет о прибылях и убытках». Согласно [176] годовую бухгалтерскую отчетность представляют в обязательном порядке в орган государственной статистики по месту государственной регистрации не позднее трех месяцев после окончания отчетного периода. Кроме того, отчетность не является закрытой информацией и может быть предоставлена заинтересованным лицам [177], поэтому возможно ее использование для осуществления экспресс-анализа финансового состояния предприятий.

Для сбора данных отчетностей предприятий был оплачен доступ к порталу «Контрагент» [178]. Выбирались отчетности предприятий Краснодарского края за 2010 - 2013 со следующими критериями [179, 180]: средняя численность работников за предшествующий календарный год N не превышает 250 человек; выручка от реализации товаров, работ или услуг не превышает 1000 млн. руб., т.е. 2110™ < 1000 , где 2110™ - строка 2110 годовой формы бухгалтерской отчетности № 2 «Отчет о прибылях и убытках»; суммарная доля участия в

уставном капитале сторонних организаций не превышает 25%, информация о чем была указана в «карточке организации» на сайте [178]. Для приблизительного расчета числа работников N была рассмотрена следующая величина:

2120™2

N =-

12* СЗП

где 2120^- строка отчетности 2120 за отчетный период равный 12 месяцам

Формы 2 «Отчет о прибылях и убытках»; СЗП - величина средней заработной платы по Краснодарскому краю в году, на который представлена отчетность согласно данным [181]. Был отобран 441 файл.

Многие финансовые коэффициенты взаимосвязаны, причем некоторые из них являются более информативными, а другие - менее. Поэтому, зачастую, совокупность большого количества данных является избыточной для анализа. В случае рассмотрения недостаточного количества данных увеличивается риск ошибки в полученных результатах анализа. В связи с этим остро встает вопрос о выборе минимальной совокупности показателей наиболее полно характеризующей финансовое состояние заемщика.

Ниже представлена таблица 4.1, в которой отражена связь между элементами модели состава и финансовыми коэффициентами. В первом столбце таблицы указаны наименования финансовых коэффициентов, для расчета которых используются соответствующие данные бухгалтерской отчетности, приведенные во втором столбце; в третьем - элементы, отражение которых нашло в этих данных, а в четвертом - форма бухгалтерской отчетности, используемая в качестве источника получения численных значений. Из таблицы видно, что все элементы состава предприятия МСБ нашли свое отражение во множестве финансовых коэффициентов.

Таким образом, выбранная система экономических показателей, всесторонне характеризует финансовое состояние торгово-производственного предприятия, а значит, является полной и может послужить основой для определения его финансового состояния.

Таблица 4.1 - Таблица данных для подсчета финансовых показателей

Показатель Данные Элементы модели состава Источник данных

Rl балансовая прибыль (нераспределенная прибыль) Э1, Э6 Ф1

Rl внереализационные доходы Э1, Э6, П1-П3, С8-С10 Ф2

F2, Fз внеоборотные активы (итого на конец отчетного периода) Э1, Э7, П1-П3, Пр4-Пр7, С1, С2, С5-С7 Ф1

Rl, R4 выручка от продаж Э1, Э6, С1-С4, У6 Ф.2+ декларация по НДС

А 2, А 5 выручка от продажи (за вычетом налога на добавленную стоимость, акцизов и др. обязательств) Э1, Э6, П6-П10, С1-С4, У4-У6 Ф2

А4 выручка от продажи без учета коммерческих и управленческих расходов: Э1, Э6, У4-У6, П1-П3, С1-С4,У6 Ф2

А5 дебиторская задолженность на конец отчетного периода Э2 Ф1 или Ф5

Fl долгосрочные обязательства (итого) Э2 Ф1

Ll, Р1, F4 долгосрочная дебиторская задолженность Э2 Ф5

Rз, F^, Fl, F2 доходы будущих периодов Э1, П1-П3, Пр1-Пр3, С1-С4, У1-У3 Ф1

А5 задолженность учредителей по вкладам в уставной капитал на конец отчетного периода Э2 Уставной капитал, Ф1

Ll, Fз Запасы Э1, Э6, П1-П3 Ф1

Rз, Fl, F2, F4 капитал и резервы (за вычетом собственных акций, выкупленных у акционеров) Э1, Э6, П1-П3 Ф1

L2 краткосрочная кредиторская задолженность Э2, Э6, Э7 Ф1

Продолжение таблицы 4.1

Ll, Р1, Fl краткосрочные обязательства (не включая доходы будущих периодов) Э2 Ф1

L2 краткосрочные займы и кредиты Э2 Ф1

Ll налог на добавленную стоимость по приобретенным ценностям П6-П10, П1-П3 Ф1

Ll, Р1, F2 оборотные активы Э1,Э2, П1-П3, Пр1-ПрЗ Ф1

R4 прибыль от продаж Э1, Эб, Э7, С1-С4, Уб Ф2

Аб себестоимость запасов Э1, Эб, П1-П3, Пр1-ПрЗ Ф2

L2, Fз собственные оборотные средства Э1, Эб, П1-П3 Ф1

R2 А2 средняя балансовая стоимость активов Э1, Э2, Эб, Э7, П1-П3, Пр4-Пр7, С1-С4, У4-Уб Ф1

R5 средняя стоимость оборотных активов Э1, Э2, Эб, П1-П3, Пр1-Пр3 Ф1

Аб L2 средняя величина запасов Э1, Э2, Эб, П1-П3 Ф1

А4 средняя кредиторская задолженность Э2 Ф1

Rз, Fl, F% F4 целевые финансирование и поступления Э2, Эб, Э7, П1-П3, Пр1-Пр3, С1-С4, У4-Уб Ф1

Rъ Rз, R5 чистая прибыль отчетного периода Э1, Эб, Э7, Пр1-Пр3, Уб Ф2

Приложение: Ф1 - Форма 1 «Бухгалтерский баланс», Ф2 - Форма 2 «Отчет о прибылях и убытках», Ф5 - Форма 5 «Приложение к бухгалтерскому балансу».

Таким образом, выбранная система экономических показателей, всесторонне характеризует финансовое состояние торгово-производственного предприятия, а значит, является полной и может послужить основой для определения его финансового состояния.

Анализ информативности каждого из системы 28 финансовых коэффициентов на основе собранных данных реальных предприятий МСБ позволил выявить и исключить из рассмотрения три показателя, более 80% значений которых обращались в ноль или были неограниченны по модулю. К малоинформативным были отнесены коэффициенты маневренности собственного капитала (Р7), долгосрочного привлечения заемных средств (Р9), долгового покрытия активов (Р10).

На следующем этапе анализа значений оставшихся 25 финансовых коэффициентов были исследованы диапазоны значений. Оказалось, что значения четырех коэффициентов неограничены сверху. Это коэффициенты фондоотдачи (А1), оборачиваемости собственного капитала (А3), оборачиваемости дебиторской задолженности (А5) и соотношения заемных и собственных средств (Р8). Для осуществления дальнейшего анализа эти коэффициенты заменили на обратные им

1111

величины: —, —, —,—.

А1 А3 А5 Р8

Таким образом, система финансовых коэффициентов составила 25 экономических показателей, разделенных на 4 группы. Коэффициенты рентабельности: Я1, Я2, Я3, Я4, Я5, Р6; коэффициенты ликвидности и платежеспособности: Ь1, Ь2, Ь3, Р1, Р2; коэффициенты деловой активности: 1/А1, А2, 1/А3, А4, 1/А5, А6; коэффициенты финансовой устойчивости: Р1, Р2, Р3, Р4, Р5, Рб, 1/р8, Fll.

Одним из наиболее известных в России пакетов для прикладного статистического анализа данных является пакет STATISTICA. Методы, реализованные в пакете STATISTICA, позволили произвести качественный анализ собранных данных. Каждое предприятие было рассмотрено как объект в пространстве размерности 25 - по числу финансовых коэффициентов. Для получения достоверных результатов о наличии парной линейной зависимости между коэффициентами по каждому показателю при помощи диаграмм размаха были выявлены и, исключены выбросы из выборочной совокупности.

На анализ стохастических взаимосвязей между финансовыми коэффициентами могут оказать влияние предприятия, деятельность которых приостановлена, либо они еще не признаны несостоятельными в соответствии с решением арбитражного суда, или уже ликвидированы в соответствии с приказом МВД РФ [182]. Для таких предприятий типичны нулевые или бесконечно большие величины финансовых коэффициентов рентабельности, так как именно эти коэффициенты несут в себе информацию о прибыли, выручке и об активах компании. Из 441 предприятия было выявлено и исключено из рассматриваемой выборки 32 таких организации.

Для оставшейся совокупности данных 409 предприятий был произведен анализ стохастической взаимосвязи между каждой парой финансовых коэффициентов. В случае выявления сильной значимой корреляции между ними (коэффициент корреляции г > 0,75), один экономический показатель рассматриваемой пары исключали из рассмотрения. Такое сокращение числа показателей способствовало созданию не избыточной системы финансовых коэффициентов. Все рассматриваемые коэффициенты измерены в интервальной шкале, поэтому для изучения их взаимосвязи был использован коэффициент корреляции Пирсона, значение которого не зависит от единицы измерения финансовых коэффициентов. Для сокращения расчетов сначала были исследованы парные корреляции внутри каждой группы, исключены зависимые показатели, а после - коэффициенты, относящихся к разным группам. В результате система финансовых коэффициентов была сокращена с 25 параметров до 20: Яз, Я4, Я5, Яб, Ьь Ь2, Ьз, Рь Р2, 1/Аь А2, 1/Аз, А4, 1/А5, Аб, Е2, Ез,

Наличие выбросов в выборочной совокупности в значительной мере влияет на среднее арифметическое, стандартное отклонение, асимметрию, эксцесс выборки, а также критерий согласия с нормальным законом. Построение обучающей выборки основано на однородности реальных и моделируемых данных. Чем однороднее данные, тем надежнее и адекватнее результаты статистического анализа на основе обучающей выборки. Однородность данных определяли схожестью средних величин и дисперсий. Поэтому наличие выбросов

в реальной совокупности данных может в значительной мере оказать влияние на моделирование обучающей выборки и, как следствие, на результаты дальнейшего классификационного анализа. К сожалению, не существует общепринятого метода автоматического удаления аномальных значений показателей. Поэтому была произведена процедура ручного поиска выбросов и крайних точек. Для замены аномальных значений коэффициентов использовали метод k - ближайших соседей, реализованный в программе STATISTICA - пропущенные данные заменяли средними величинами k схожих наблюдений. Значение к было определено минимальным числом наблюдений в группах. Группирующей переменной был выбран показатель краткосрочной финансовой устойчивости (финансовой независимости) [175]. Меньше всего наблюдений (19) было отнесено к группе со значением группирующей переменной нормальная краткосрочная финансовая устойчивость, поэтому выбрали k=19.

Задача экспресс-анализа финансового состояния предприятий МСБ подразумевает наличие некоторой порядковой шкалы [183], на основе которой дают оценку финансового состояния исследуемого объекта. Для классификации предприятий МСБ в соответствии с их финансовым состоянием ввели качественную переменную - уровень риска кризисного финансового состояния [184]. Она предусматривает градацию предприятий МСБ по 5 уровням:

1 группа - предприятия очень низкого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором без просрочек платежей;

2 группа - предприятия низкого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой до 30 дней;

3 группа - предприятия среднего уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой платежей от 30 до 90 дней;

4 группа - предприятия высокого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой платежей более 90 дней;

5 группа - предприятия очень высокого уровня риска кризисного финансового состояния, если финансовое состояние не позволяет выполнять долговые обязательства перед кредитором.

На практике часто используют бинарные и тринарные классификации, но деление объектов по пяти группам является более информативным. Использование пятиуровневой классификации позволяет более развернуто построить отношение предпочтения объектов различных групп. В то же время, деление на семь и более групп значительно рассеивает внимание и является более громоздким. Кроме того, пятиуровневая классификация предприятий выбрана в соответствии с требованиями Центрального Банка России [185] об отнесении заемщика к одному из пяти групп категорий качества клиентов на основе выполнения его обязательств перед кредитором.

По значениям финансовых коэффициентов реальных предприятий кредитными аналитиками посредством «ручного» анализа были классифицированы предприятия МСБ по пяти уровням риска кризисного финансового состояния. По три предприятия из каждой группы образовали тестовую выборку, которая в дальнейшем использовалась для кросс-тестирования методов классификационного анализа по определенным выше группам риска.

Использование кредитными аналитиками пятиуровневой классификации при «ручном» экспресс-анализе финансового состояния заемщика достаточно трудоемко, поэтому на практике такую классификацию не применяют, несмотря на все ее преимущества. Проблему отсутствия выборочных данных предприятий МСБ, классифицированных по пяти группам, можно решить путем моделирования обучающей выборки. Виртуальная обучающая выборка позволяет решить проблему поиска данных, а методы многомерного классификационного анализа на основе этой выборки позволяют не только автоматизировать

процедуру классификации, но и сделать ее научно обоснованной. Статистический анализ финансовых коэффициентов позволил создать обучающую выборку эталонных предприятий МСБ, которая обладает преимуществами в сравнении с базой данных реальных предприятий. Предприятия, принадлежащие к одной группе по уровню риска, обладают максимальным сходством по совокупности финансовых коэффициентов. В тоже время предприятия из разных групп существенно отличаются друг от друга относительно совокупности финансовых показателей. Сходство (различие) между предприятиями определили расстоянием между точками «-мерного пространства. Чем ближе расстояние, тем больше сходство и наоборот, чем больше расстояние, тем более различны предприятия.

Создание обучающей выборки основано на понятии однородности групп объектов [186]. Группы однородны, если: объекты описаны одной и той же совокупностью показателей; в таблицах данных одноименные показатели расположены в столбцах с одинаковыми номерами; одноименные показатели имеют идентичное распределение с равными выборочными средними и дисперсиями. Применительно к проблеме экспресс-анализа финансового состояния предприятий, группы объектов - это совокупности предприятий МСБ, соответствующие 5 уровням риска кризисного состояния.

Моделирование обучающей выборки эталонных предприятий МСБ было осуществлено по следующим этапам (см. §3.3):

Генерация эталонных значений финансовых коэффициентов обучающей выборки в соответствии с видом и параметрами распределений соответствующих коэффициентов реальных данных предприятий МСБ.

Классификация сгенерированных финансовых коэффициентов по диапазонам их значений на основе концепции лингвистической классификации.

Объединение отдельных значений системы коэффициентов в 20-и мерные наблюдения таким образом, чтобы можно было с высокой точностью отнести каждое предприятие к одному из пяти уровней риска кризисного финансового состояния.

Моделирование обучающей выборки на первом этапе требовало определения закона распределения значений каждого из финансовых коэффициентов и соответствующих им параметров распределения. Исследование гистограмм построенных на основе десятков тысяч отчетностей предприятий МСБ показало, что финансовые коэффициенты имеют унимодальное распределение [188]. В тоже время, согласно центральной предельной теореме сумма независимых величин с малым удельным весом имеет распределение, асимптотически приближающееся к нормальному закону при увеличении количества слагаемых. Учитывая, ранее сделанные замечания и то, что на формирование значения каждого финансового показателя влияет множество независимых равнозначных факторов, было сделано предположение о нормальности распределения значений финансовых коэффициентов. Поэтому, финансовые коэффициенты были сгенерированы датчиком нормально распределенных случайных чисел в среде пакета STATISTICA. В качестве значений параметров распределения использовали выборочные средние и стандартные отклонения реальных данных.

На втором этапе создания обучающей выборки с помощью концепции лингвистической классификации определили диапазоны очень высоких, высоких, средних, низких, очень низких значений финансовых коэффициентов. Очень высокие значения характеризуют предприятия очень низкого уровня риска кризисного финансового состояния; высокие - низкого; средние - среднего и т.д. Концепция лингвистической классификации позволила установить логическую связь количественных значений финансовых коэффициентов с качественным показателем, характеризующим финансовое состояние на основе значений функции принадлежности. Согласно методике построения модельной обучающей выборки был построен пятиуровневый классификатор - пенташкала [189] и определены среднее выборочное - /, выборочное среднеквадратическое отклонение - с, выличины очень высоких - хОВ, высоких - хВ, низких - хН и очень низких - хОН значений каждого из 20 финансовых коэффициентов. В таблице 4.2 приведены полученные данные, в два последних столбца таблицы занесли рассчитанные значения коэффициентов Стьюдена - t1 и

Таблица 4.2 - Таблица значений статистик для построения пенташкалы

Коэффициент Д а •ОН •н •в •ов и t2

Яз 0,30 0,53 - 0,36 0,00 0,60 1,00 1,28 0,58

0,05 0,13 - 0,15 0,00 0,10 0,30 1,72 0,24

Я5 0,12 0,42 0,00 0,10 0,50 1,00 1,19 0,47

Яб 1,85 4,12 - 1,00 0,00 3,00 5,00 1,99 0,73

Ll 0,81 0,61 0,10 0,60 1,00 1,50 1,15 0,37

L2 0,36 0,32 0,00 0,20 0,50 0,70 1,09 0,38

Lз 0,67 0,79 0,00 0,35 1,00 1,35 0,86 0,53

Р1 1,24 1,27 0,00 1,00 1,50 2,50 0,98 0,34

Р2 0,40 2,22 - 0,20 0,10 0,70 1,00 0,37 0,27

1/Лх 0,01 0,08 0,00 0,01 0,03 0,04 0,26 0,11

А2 1,94 1,88 0,00 0,50 2,50 4,00 1,59 1,06

1/Аз 0,13 0,25 1,00 0,30 0,20 0,10 1,81 0,03

А4 2,38 3,98 0,00 1,00 4,00 5,00 1,58 0,63

1/Аъ 0,35 0,28 1,00 0,60 0,20 0,01 1,77 0,52

Аб 4,12 8,79 1,00 2,50 5,50 7,00 1,69 0,34

Fl 0,52 4,94 1,00 0,70 0,30 0,00 0,20 0,10

F2 0,47 0,48 0,00 0,25 0,75 1,00 1,04 0,51

Fз 0,51 1,11 0,00 0,25 0,75 1,00 0,45 0,37

F4 0,20 0,17 - 0,10 0,10 0,30 0,50 1,74 0,39

Fll 0,62 1,77 - 0,30 0,10 1,10 1,50 0,51 0,65

На следующем этапе строили зоны абсолютной, пониженной уверенности и абсолютной неуверенности. Для этого в качестве U взяли значение равное 2. Данный выбор основан на апробации функций принадлежности по диапазонам значений финансовых коэффициентов. В случае U=1 некоторые нормативные значения попадали в зону пониженной уверенности. При выборе U=3, ситуация менялась в противоположную сторону - присутствовали значения из зоны пониженной уверенности, которые попадали в зоны абсолютной неуверенности или абсолютной уверенности. Для узловых точек щ, щ2, щ3, щ, щ5, которые были вычислены по формулам (3.1), среднего - щ, стандартного отклонения - а и интервала значений финансового коэффициента - (а; ß) вычислили зоны абсолютной уверенности по диапазонам финансовых коэффициентов. Для расчета зон абсолютной уверенности положительно ориентированных коэффициентов использовали формулы (3.2).

Интервалы пониженной уверенности, согласно методике, определены значениями из (а; ß), которые не попали в зону абсолютной уверенности. Общий вид пенташкалы для положительно определенного финансового показателя представлен на рисунке 4.6.

0,5

ОН

Н

Ср

В

ОВ

а

Ц1

Ц 2

Ц3

Ц 4

Ц5

ß

Рисунок 4.6 - Пенташкала в общем виде для положительно ориентированного

финансового показателя

Согласно таблице 4.2 и формулам (3.1) и (4.2) для каждого коэффициента были построены интервалы, отражающие зоны абсолютной уверенности его

1

отнесения к одному из 5 диапазонов финансового коэффициента. Идентификация зон абсолютной и пониженной уверенности позволила каждому значению показателя присвоить 5 значений функций принадлежности. Значения функций отражают уверенность кредитного аналитика в принадлежности значения финансового коэффициента тому или иному диапазону. Значение коэффициента было отнесено к тому диапазону значений финансового показателя, которому соответствовало наибольшее значение функции принадлежности. Таким образом, все значения финансовых коэффициентов были распределены по диапазонам на основе концепции лингвистической классификации.

На третьем этапе моделирования обучающей выборки произвели объединение отдельных значений финансовых показателей в 20-мерные наблюдения, соответствующие виртуальным предприятиям. Предприятие было отнесено к группе очень низкого уровня риска кризисного финансового состояния, если все значения финансовых коэффициентов принадлежали очень высокому диапазону. Если все значения были из высокого диапазона значений, то -предприятие относили к группе низкого уровня риска кризисного состояния; если из среднего - в группу среднего уровня риска. В группы высокого и очень высокого уровней риска кризисного состояния отнесли наблюдения, все значения финансовых коэффициентов которых из низкого и очень низкого диапазонов соответственно. В итоге было получено 1878 предприятий, относящихся к пяти определенным группам уровней риска кризисного финансового состояния.

Для остальных 4122 предприятий классификацию производили по правилу объединения смежных классов: предприятию присваивали некоторый уровень риска кризисного состояния, если 75% и более значений показателей (т.е. более 15 показателей) попадали в соответствующий диапазон значений финансового коэффициента, а остальные (менее 25%) - в смежный. Было сгруппировано 2317 таких наблюдений в обучающей выборке.

Остальные 1805 предприятий - это наблюдения с наименьшими значениями функций принадлежностей каждого финансового коэффициента по различным диапазонам. Это значит, что для них значения финансовых коэффициентов

располагались вблизи точек наибольшего противоречия пенташкалы. Такие объекты составили наиболее неопределенную часть обучающей выборки. Классификация этих объектов производилась по принципу близости к центрам групп уровней риска кризисного финансового состояния. В качестве меры было взято евклидово расстояние в 20-мерной системе координат (по числу финансовых коэффициентов). Объекту присваивался тот уровень риска, к центру которой он находился ближе всего. Все наблюдения были классифицированы однозначно по пяти группам риска. Примечательно, что 1715 наблюдений (это более 95% от классифицируемых) попали в группы высокого, среднего и низкого уровня риска, а остальные 90 (менее 5%) - в группы очень высокого и очень низкого уровня.

Таким образом была создана обучающая выборка 6000 предприятий МСБ по системе 20 финансовых коэффициентов, которая однородна к реальной выборке предприятий МСБ, но лишена ее недостатков: малого объема данных, несоответствия нормальному закону распределения признаков и наличия выбросов.

Была проведена проверка схожести предприятий, принадлежащих одному классу и максимальной различимости предприятий различных классов, проведенной на основе визуализации (§4.5). Результаты показали, что сгенерированные данные качественно определяют принадлежность предприятий к классам, и что предприятия одного класса образуют единый кластер.

4.2 Применение методов классификационного анализа

Для проведения экспресс-анализа финансового состояния заемщика был использован дискриминантный анализ [190, 191, 192]. В качестве обучающей выборки использовали построенную на предыдущем этапе работы эталонную выборку 6000 предприятий МСБ. Все предположения необходимые для проведения параметрического дискриминантного анализа выполнены в соответствии с методикой построения выборки.

Проведенный дискриминантный анализ позволил ранжировать финансовые показатели по степени их значимости в процессе классификации предприятий. В таблице 4.3 представлены результаты дискриминантного анализа данных.

Таблица 4.3 - Итоговая таблица дискриминантного анализа данных

Показатель Число переменных: 20; Группирующие переменные: Классы (5 групп); Лямбда Уилкса: 0,00000 F(б4,3838)=1300,3 р<0,0000

Лямбда Уилкса Частная лямбда Значение F-критерия Уровень значимости р F-критерия Толерантность

Я3 0,00160 0,932 108,716 0,000 0,814

Я4 0,00152 0,981 29,374 0,000 0,782

Я5 0,00156 0,956 68,574 0,000 0,723

Я6 0,00161 0,926 119,539 0,000 0,748

Ll 0,00150 0,994 9,694 0,000 0,616

L2 0,00158 0,945 86,326 0,000 0,812

Lз 0,00164 0,911 145,744 0,000 0,769

Р1 0,00162 0,923 124,848 0,000 0,720

Р2 0,00154 0,968 49,461 0,000 0,848

1/А1 0,00155 0,966 52,819 0,000 0,543

А2 0,00181 0,825 316,472 0,000 0,763

1/Аз 0,00528 0,283 3786,901 0,000 0,888

А4 0,00270 0,554 1202,669 0,000 0,852

1/А5 0,00150 0,993 11,014 0,000 0,674

А6 0,001886 0,791603 393,309 0,000 0,931

Fl 0,001496 0,998014 2,973 0,018 0,976

F2 0,001569 0,951650 75,904 0,000 0,700

Fз 0,001589 0,939712 95,849 0,000 0,783

F4 0,001564 0,954548 71,139 0,000 0,876

Fll 0,001525 0,978943 32,135 0,000 0,720

Лямбда Уилкса модели вычисляется как отношение детерминанта матрицы внутригрупповых дисперсий/ковариаций к детерминанту общей ковариационной матрицы. Она принимает значения из интервала [0;1], причем значения близкие к 0 говорят о хорошей дискриминации, а близкие к 1 - о плохой. Лямбда Уилкса построенной модели принимает значение близкое к нулю (с точностью до 5 знака), что свидетельствует о хорошей дискриминации. Значения статистики лямбда Уилкса, являющейся результатом исключения соответствующей переменной. Чем больше ее значение, тем более желательно присутствие этой переменной в процедуре дискриминации. Из таблицы видно, что наиболее желательными коэффициентами в модели являются коэффициенты 1/А3, А4 и А6. Величина единичного вклада соответствующей переменной в разделительную силу модели определена значением частной лямбды Уилкса: чем меньше ее величина, тем больше вклад параметра в общую дискриминацию. Она равна отношению лямбды Уилкса после добавления соответствующей переменной в модель к лямбде Уилкса до добавления этой переменной. Из таблицы видно, что показатели 1/А3, А4, А6 - важные переменные в процедуре дискриминации предприятий по группам риска.

Толерантность (То1ег) - это мера избыточности переменной в модели. Чем больше ее значение и меньше значение уровня значимости р, тем больше вклад переменной в процедуру дискриминации модели, тем большую она несет дополнительную информацию. Из таблицы видно, что все значения толерантности намного больше нижней границы (0,01) и уровень значимости р<0,05, поэтому все показатели были успешно включены в модель.

Для получения дальнейших результатов о природе дискриминации провели канонический анализ. Для оценки того, как двадцать переменных разделяют различные совокупности (группы предприятий), вычислили четыре дискриминантные функции (число групп минус один). Результат пошагового критерия для дискриминантных функций (канонических корней) показал, что все четыре дискриминантные функции статистически значимы, так как уровень значимости каждой оказался р<0,05. Значения стандартизованных коэффициентов

дискриминантных функций принадлежат к одной и той же шкале измерений (абсолютной), поэтому их можно сравнивать, чтобы определить величины и направления вкладов переменных в каждую каноническую функцию. Результаты анализа показали, что в дискриминантную функцию 1 наибольший вклад внесли переменные А6 и 1/Аз, в дискриминантную функцию 2 - 1/Аз и Р1, в дискриминантную функцию 3 - А4 и 1/Аз, в дискриминантную функцию 4 - А2 и 1/А1. Анализ результатов показал, что функция 1 ответственна за 79,17% объясненной дисперсии, т.е. 79,17 % всей дискриминирующей мощности определено этой функцией. Поэтому эта функция наиболее «важна». Функция 2 ответственна за 16,75 % объясненной дисперсии, функция 3 - за 2,79 %, а функция 4 - за 1,29 %.

Таблица 4.4 средних значений для дискриминантных функций позволила определить группы, лучше всего идентифицируемые конкретной дискриминантной функцией.

Таблица 4.4 - Средние значения канонических переменных

Группы риска Средние значения канонических переменных

Корень 1 (функция 1) Корень 2 (функция 2) Корень 3 (функция 3) Корень 4 (функция 4)

очень высокий - 7,746 2,357 0,134 - 0,091

высокий - 2,539 - 3,607 - 2,714 - 0,231

средний 0,320 - 2,911 1,061 - 0,236

низкий 4,264 0,873 - 0,137 1,015

очень низкий 8,895 2,995 - 0,333 - 1,298

Из таблицы видно, что дискриминантная функция 1 лучшим образом идентифицирует класс очень высокий уровень риска кризисного финансового состояния, так как расстояние между каноническими средними смежных с ним классов несколько больше расстояний между средними других смежных классов. Функция 2 идентифицирует все классы примерно в равной степени;

дискриминантная функция 3 - в основном класс высокий уровень риска, а функция 4 - низкий.

Дискриминантные функции позволяют объекты многомерного пространства (в нашем случае размерности 20) представить в виде объектов пространства размерности 2, т.е. в виде точек на плоскости, сохранив порядок расстояний между ними. Объекты близкие друг к другу (сходные) в многомерном пространстве остаются близкими и на плоскости. Поэтому для визуализации элементов обучающей выборки на плоскости использовали диаграмму рассеяния (рисунок 4.7) канонических значений в системе координат Корень 1, Корень 2. Наблюдения одной группы изображены определенными цветом и определенной геометрической фигуркой.

Рисунок 4.7 - Диаграмма рассеяния значений дискриминантных функций в

системе координат Корень 1 , Корень 2

На диаграмме видно, что фигуры, соответствующие наблюдениям одного класса, локализованы в определенных областях плоскости. Основное различие между классами проявляется в последовательном расположении групп с однотипными фигурками вдоль оси Корень 1. При этом, центр класса очень высокий уровень риска кризисного финансового состояния находится дальше от остальных классов, что соответствует распределению средних значений канонических переменных Корня 1 (см.табл. 4.4).

Матрица классификации (таблица 4.5) содержит информацию о количестве и проценте корректно классифицированных наблюдений в каждой группе. Строки таблицы отражают исходные классы, а столбцы - предсказанные. Из таблицы видно, что правильная классификация составила 96,18%. Подавляющее большинство ошибочно классифицированных наблюдений были отнесены в смежные классы: из 229 наблюдений всего 2 попало не в смежный класс к исходному, что составило 0,87% от общего числа ошибочно классифицированных или 0,03% от всех предприятий обучающей выборки. Высокий процент верно классифицированных предприятий позволяет сделать вывод о проведении успешной дискриминации.

Таблица 4.5 - Матрица классификации

Классы % правильно классифиц. Очень низкий р=0,1145 Низкий р=0,25617 Средний р=0,28117 Высокий р=0,09533 Очень высокий р=0,25283

Очень низкий 99,71 685 2 0 0 0

Низкий 92,52 104 1422 11 0 0

Средний 97,81 0 26 1650 9 2

Высокий 86,89 0 0 68 497 7

Очень высокий 100,00 0 0 0 0 1517

Всего 96,18 789 1450 1729 506 1526

Отнести предприятие к одному из пяти обозначенных классов позволяет таблица апостериорных вероятностей, в которой каждому наблюдению

поставлена в соответствие вероятность принадлежности к группам риска кризисного финансового состояния. Эти вероятности рассчитаны на основе значений априорных вероятностей и посредствам расстояний Махалонобиса. Чем дальше наблюдение от центра группы, тем менее вероятно, что оно принадлежит этой группе. Предприятие приписывают к той группе риска кризисного финансового состояния, которой соответствует наибольшая апостериорная вероятность классификации.

Классификацию реально существующего предприятия на основе данных о его финансовой деятельности можно производить одним из двух способов: либо по значениям апостериорных вероятностей по классам, либо построив линейные функции классификации для каждой группы риска. Наблюдение приписывают к той группе риска, для которой классификационная функция имеет наибольшее значение. Значения коэффициентов функций классификации были использованы для построения классификационных функций для каждой группы уровня риска кризисного финансового состояния:

^ОНР = R3•2,983 - R4•0,344 + R5•0,009 + R6•2,261 + ¿ГП,766 + L2•20,759 + Lз•38,154 + Рг12,360 + Р^2,785 + Шг585,357 + ^-6,648 + 1/^24,329 + Аг2,091 + 1/А5-7,697 + А^7,407 + Fl•0,259 + F2•10,321 + F3•2,741 + F4•14,Ш - ^г1,179 -142,971;

2НР = R3•2,759 - R4•2,853 - R5•1,899 + R6•2,094 + L1•9,141 + L2• 16,562 + Lз•27,445 + Рг8,358 + Р^2,013 + Шг460,578 + А^3,335 + 1/Лг 24,804 + ^-1,923 + 1/^5,742 + А64,880 + F1• 0,301 + F2•11,927 + F3•2,949 + F4•9,167 - F11•3,326 -70,918;

2СР = R3•2,793 - R4•12,976 - R5•5,419 + Д<г1,101 + L1•8,974 + L2•9,734 + Lз•17,784 + Рг4,959 + Р2Ю,892 + Шг493,110 + А^3,610 + 1/^36,504 + Ат2,904 + 1/А54,153 + А6-2,550 + F1•0,488 + F2•12,387 + F3•2,371 + F4•2,010 - ^-1,681 -45,671;

2ВР = R3•2,661 - R4•18,327 - R5•4,717 + Д<г1,097 + L1•7,740 + L2•0,458 + Lз•17,085 + Рг3,588 - Р2-2,436 + Шг533,289 + ^-1,973 + 1/^348,130 + ^0,723 +

Ш54,477 + A64,477 + Fr0,452 + F^16,224 + Fr0,767 - F4-1,022 - F1r3,195 -37,991;

ZOBP = -R34,698 - R4-26,739 - R54,988 - R6^0,234 + Lr8,005 + L^2,510 + L3-11,037 + Pr3,939 - P2^2,663 + 1/^1-436,641 + ^2,284 - 1/^14,182 + Af0,119 + 1/A^3,849 + А6Ю,268 + Fr0,430 + F2-4,877 + Fr0,414 - F4^14,563 - Fn-4,025 -19,148.

На основе построенной методом дискриминантного анализа модели классификации для каждого класса в среде программирования Statistica Visuale Basic (SVB) был разработан макрос, позволивший произвести классификацию реально существующих предприятий МСБ по данным их бухгалтерской отчетности [193]. На его основе была осуществлена кросс-проверка, построенной модели. В качестве тестируемой выборки брали базу 15 реальных данных предприятий МСБ, классификация которой была произведена экспертом. Результаты кросс-проверки представлены в таблице 4.6. Высокий процент совпадений групп исходной и предсказанной классификации говорит об адекватности построенной модели. Разработанный макрос в качестве модуля включен в состав итоговой системы поддержки принятия решений для экспресс-анализа финансового состояния предприятий МСБ.

Таблица 4.6 - Результаты кросс-проверки

Исходные классы уровней риска Предсказанные классы уровней риска

очень низкий низкий средний высокий очень высокий

очень низкий 3 0 0 0 0

низкий 0 2 1 0 0

средний 0 0 3 0 0

высокий 0 0 0 2 1

очень высокий 0 0 0 0 3

Решение задачи экспресс-анализа финансового состояния МСБ возможно посредствам применения бинарных моделей. Отклик Y назовем финансовым состоянием, который принимает, в силу своей бинарности, два значения, назовем их - приемлемое, неприемлемое. Отклик позволит разбить обучающую выборку предприятий на две группы. В группу приемлемое финансовое состояние включим предприятия, принадлежащие к очень низкому и низкому уровню риска кризисного финансового состояния. В группу неприемлемое финансовое состояние включим предприятия очень высокого, высокого и среднего уровня риска кризисного финансового состояния. Такая классификация соответствует решению кредитной организации предоставить, или не предоставить кредит. Будем считать, что если Y е [0; 0,5] , то отклик Y принимает значение

неприемлемое; если Y е (0,5; 1], то - приемлемое.

На платформе пакета STATISTICA по обучающей выборке была построена вероятностно-статистическая модель логит-регрессии, в которой в качестве независимых переменных рассмотрены финансовые показатели. Для нахождения коэффициентов регрессии b0,...,b20 использовали процедуру «Логит регрессия» модуля «Нелинейное оценивание» пакета STATISTICA 10 [194]. В качестве процедуры оценивания был выбран метод Хука-Дживиса по минимуму ошибок матрицы классификации. Адекватность построенной логит модели оценивали по значению уровня значимости р критерия Хи-квадрат. Значение параметра Хи-квадрат построенной модели достаточно велико (х =7640,2), а значение уровня значимости - мало (р=0,000), поэтому можно говорить о достаточной адекватности выбранной модели.

Адекватность модели также определяли количеством ошибок классификации наблюдений, осуществленной в соответствии с построенной моделью. В таблице 4.7 в строках указана исходная классификация наблюдений (предприятий), в столбцах - предсказанная по модели. Так 3596 предприятий группы приемлемое финансовое состояние были предсказаны верно и 15 -ошибочно предсказаны как предприятия неприемлемого финансового состояния.

Таблица 4.7 - Таблица количества ошибок классификации наблюдений

Наблюдаемый уровень финансового состояния

Предсказанный уровень % правильной

финансового состояния классификации

неприемлемый Приемлемый

Неприемлемый 2275

26

98,87

Приемлемый

15

3596

99,58

В тоже время 26 предприятий неприемлемого финансового состояния были ошибочно классифицированы моделью как предприятия приемлемого финансового состояния и 2275 - правильно предсказаны как предприятия неприемлемого финансового состояния. Проценты безошибочных классификаций составили соответственно 98,87 и 99,58%. Общий процент верно классифицированных моделью предприятий равен 99,31%. Если эти проценты считать статистическими вероятностями, то вероятность, того что предприятие обладает хорошим финансовым состоянием при его отнесении к группе приемлемого финансового состояния, составила 0,9958. А вероятность неудовлетворительного финансового состояния при классификации в группу неприемлемого - 0,9887. Общая вероятность правильного прогноза составила

Согласно результатам анализа в модель были включены все показатели, так как уровень значимости р критерия Стьюдента каждого из них не превысил 0,5. На основе полученных значений коэффициентов регрессии была построена адекватная логит модель:

где г = - 4,824 + 2,413^з + 13,835^ + 0,446^5 + 0,020^6 - 3,238^ + 13,257^2 -2,804^з + 1,550^ + 2,384-Р2 - 147,457-1/^ - 1,911-А2 - 8,07Ы/А3 + 1,770А + 1,446-1/А5 + 0,934-А - 0,030^ - 2,279•F2 + 2,752^з + 5,021•F4 - 0,043^п.

Модель логит-регрессии легла в основу макроса классификации предприятий МСБ по двум группам финансового состояния [195], который был реализован в

0,9931.

среде программирования SVB. Макрос позволил провести кросс-проверку построенной модели на основе тестовой выборки 15 реальных предприятий. Результаты кросс-тестирования представлены в таблице 4.8.

Таблица 4.8 - Результаты кросс-проверки

Исходный уровень финансового состояния Предсказанный уровень финансового состояния

неприемлемый приемлемый

Неприемлемый 6 0

Приемлемый 2 7

Высокие проценты верной классификации в каждом из классов говорят об адекватности построенной модели. Об успешности классификации так же можно судить по общему числу верно классифицированных предприятий: 13 предприятий из 15 попали в исходные классы финансового состояния.

Макрос классификации предприятий по двум классам финансового состояния был включен в качестве программного модуля в разрабатываемую классификационную систему поддержки принятия решений при экспресс-анализе финансового состояния предприятий МСБ.

Метод деревьев классификации не имеет ограничений на закон распределения количественных предикторов, что делает его удобным в использовании, если отказывают все традиционные методы. Построение дерева классификации по пяти группам уровней риска кризисного финансового состояния производилось в три основных этапа [196]: выбор критерия точности прогноза; выбор типа ветвления; определение «подходящего размера» дерева.

Критерий точности прогноза определили наименьшей ценой - долей неверно классифицированных наблюдений. Цена ошибки правильной классификации была принята равной 0. Шаг цены ошибки классификации был принят равным 0,25, причем цена принималась тем больше, чем «дальше» от исходного класса был предсказанный. В таблице 4.9 представлена матрица цен ошибок классификации.

Таблица 4.9 - Матрица цен ошибок

Уровень риска очень высокий высокий средний низкий очень низкий

очень высокий 0 0,25 0,5 0,75 1

высокий 0,25 0 0,25 0,5 0,75

средний 0,5 0,25 0 0,25 0,5

низкий 0,75 0,5 0,25 0 0,25

очень низкий 1 0,75 0,5 0,25 0

В модуле деревья классификации программы STATISTICA реализованы два алгоритма ветвления: QUEST и CART. Метод CART (Classification And Regression Trees) предполагает полный перебор всех возможных вариантов ветвления по каждому признаку, тип которой может быть любым. Время реализации данного метода гораздо больше метода QUEST в случае значительного числа уровней и признаков. Метод QUEST - быстрый и несмещенный. Отсутствие у метода QUEST смещения в выборе переменных для ветвления также является его достоинством в случаях, когда одни предикторные переменные имеют мало уровней, а другие - много. Сочетание опций QUEST и CART позволяет полностью использовать всю гибкость аппарата деревьев классификации. Для задачи классификации предприятий по 5 уровням риска метод CART показал более качественную классификацию, чем метод QUEST. Для него удалось построить дерево классификации с наименьшей ценой глобальной кросс-проверки (0,0435), которому соответствует наименьшее количество ошибок классификации [197]. Из всех вариантов ветвления выбрали тот, который дает наибольший рост для критерия согласия. В качестве критерия согласия, из трех мер, предусмотренных программой STATISTICA, выбрали меру %2 Бартлета [198].

Выбор дерева классификации «подходящего размера» осуществлялся со значениями параметров, соответствующими методу автоматического построения дерева Бримана [199]: стандартной ошибкой равной 1; остановкой по ошибке классификации. Минимальное число неправильно классифицированных

наблюдений в терминальной вершине было принято равным 5. На рисунке 4.8 изображен граф построенного дерева классификации. Так как дерево бинарное, то из каждой вершины выходят две ветви. Под вершинами указаны условия перехода по ветвям. Левая ветвь отвечает за выполнение условия, правая - за нарушение. Красным пунктиром обозначены терминальные вершины (листья) дерева, дальнейшее ветвление из которых невозможно. Построенное дерево имеет 19 ветвлений и 20 терминальных вершин.

Средний Высокий

Рисунок 4.8 - Граф дерева классификации при выборе типа ветвления по методу

CART

Адекватность модели определяли количеством верно и ошибочно классифицированных наблюдений. Ниже представлена матрица классификации (таблица 4.10) согласно построенной модели. Строки отражают предсказанные

классы, а столбцы - исходные. Из таблицы видно, что исходные и предсказанные группы имеют высокий процент совпадений - 95,65% всех предприятий классифицировано верно. Заметим, что более 98,85% всех неверно классифицированных предприятий попало в смежные с исходным классом группы риска кризисного финансового состояния, это составило 99,95% от общего числа предприятий выборки. Результаты классификации позволили сделать вывод об адекватности построенной модели.

Таблица 4.10 - Матрица классификации

Предсказанные группы уровней риска Наблюдаемые группы уровней риска

очень низкий 687 низкий 1537 средний 1686 высокий 572 очень высокий 1518

очень низкий 631 75 0 0 0

Низкий 56 1451 34 0 0

Средний 0 10 1626 52 0

Высокий 0 0 24 513 0

очень высокий 0 1 2 7 1518

Числовые значения из таблицы решающих правил (условий ветвления) были использованы в качестве коэффициентов для составления линейных функций, представляющих собой условия перехода алгоритма классификации предприятий МСБ по пяти уровням риска кризисного финансового состояния. Математическая модель отнесения предприятий к одному из пяти уровней риска методом деревьев классификации была определена комбинацией линейных функций условного перехода согласно указанным выше решающим правилам. На основе построенной модели в среде программирования SVB разработали макрос [200], который был включен в систему поддержки принятия решений для экспресс-анализа финансового состояния предприятий МСБ в качестве модуля. На основе тестовой выборки 15 реальных предприятий посредствам макроса была проведена кросс-проверка построенной модели. Результаты кросс-тестирования представлены в

таблице 4.11. Из таблицы видно, что классификация была произведена успешно, 4 предприятия попали в смежные к исходным классы. Результаты кросс-проверки позволяют говорить об адекватности построенной модели.

Таким образом, была построена адекватная модель классификации предприятий МСБ по уровням риска кризисного финансового состояния на основе метода деревьев классификации и разработан макрос построенной модели.

Таблица 4.11 - Таблица классификации кросс-проверки

Наблюдаемые группы уровней риска Предсказанные группы уровней риска

очень низкий низкий средний высокий очень высокий

очень низкий 2 1 0 0 0

низкий 0 1 2 0 0

средний 0 0 3 0 0

высокий 0 0 0 3 0

очень высокий 0 0 0 1 2

Классификация и регрессия - основные области практического приложения нейронных сетей [201]. Сети с прямой связью являются универсальным средством аппроксимации функций, что позволяет их использовать в решении задач классификации. Как правило, нейронные сети оказываются наиболее эффективным способом классификации, потому что генерируют фактически большое число регрессионных моделей (которые используются в решении задач классификации статистическими методами). В задаче классификации предприятий по уровням риска кризисного финансового состояния целью является построение нейронной сети, которая относит каждое наблюдение к одному из классов и соответствует наименьшему количеству ошибок классификации [202]. Для построения сети использовали пакет STATISTICA Automated Neural Networks фирмы Statsoft.

Обобщенная схема моделирования системы методами искусственных нейронных сетей представлена в [203]. При моделировании нейронной сети для

классификации предприятий по уровням риска кризисного финансового состояния использовали следующий алгоритм:

1. Выбор обучающего, контрольного и тестового множества наблюдений;

2. Выбор топологии сети, функции активации, подходящего алгоритма обучения сети;

3. Оценка качества работы сети по подтверждающему и тестовому множеству с целью оптимизации архитектуры, т.е. уменьшения весов, прореживания и т.д. Если ошибка на обучающем множестве была не приемлемой, то возвращались и изменяли метод обучения сети. Если же ошибка на обучаемом множестве была допустима, а результаты классификации тестовой выборки неудовлетворительны, то возвращались на второй этап алгоритма;

4. Диагностика сети по степени влияния различных факторов на принимаемое решение (эвристики), оценка доли случаев неправильной классификации.

Для того чтобы сконструировать хороший классификатор, очень важно иметь в своем распоряжении качественные исходные данные. Поэтому на первом этапе созданную ранее выборку 6000 предприятий разбили на две - обучающую и контрольную средствами программы STATISTICA. В качестве тестового множества рассмотрели данные 15 реально существующих предприятий, классификация которых была осуществлена экспертом на основе данных их бухгалтерской отчетности.

На втором этапе строили сеть, обучение которой есть минимизация квадратичной ошибки на обучающем множестве с использованием градиента. Градиент оценки вычисляли методом двойственности, а именно, методом обратного распространения ошибки, который является алгоритмом градиентного спуска. Функцией активации выбрали логистическую функцию, а функцией ошибки - среднеквадратичную.

Топологию сети определили нелинейной многослойной сетью прямого распространения. Примерами такой сети являются сеть на основе радиальной базисной функции (RBF) и многослойный персептрон (MLP). Согласно следствию

теоремы Колмогорова-Арнольда-Хехт-Нильсена [204] рассматривали однородную нейронную сеть первого порядка с одинаковыми функциями активации, с одним промежуточным слоем, с последовательными связями и с конечным числом нейронов, имеющих сигмоидальные передаточные функции. Количество скрытых слоев в RBF соответствует 1, как и в двухслойном персептроне (входной, скрытый, выходной). Поэтому при тестировании в качестве типа нейронной сети выбирали двухслойный персептрон и радиальную базисную функцию. Выбор оптимального количества нейронов в скрытом слое был основан на минимуме ошибок обучения и кросс-проверке.

Во всех случаях нужно помнить, что на результат обучения сети могут сильно влиять параметры алгоритма обучения. Окончательный выбор зависит от того какая требуется скорость выполнения. Как правило, чем меньше сеть тем дольше она обучается и тем быстрее она работает [205]. Самое важное - выбрать число нейронов в промежуточном слое. По условию задачи размерность входного вектора равна Ых =20, поэтому входной слой содержит 20 нейронов; число

нейронов в выходном слое соответствует числу классов (N =5). Неизвестным

является число нейронов в промежуточном слое N . Основным способом его нахождения остается перебор и выбор лучшего варианта [206]. Для приблизительной оценки числа нейронов в скрытом слое однородной нейронной сети с сигмоидальными передаточными функциями воспользовались формулой, являющейся следствием из теоремы Арнольда-Колмогорова-Хехт-Нильсона [207]:

NN.

Л лг Л

у Р

< N < N

1 + Np) ^ у

N

Р

+1

V N у

(Nx + Nv +1) + N

>2 V р.

где Nу - размерность выходного сигнала,

N - число элементов обучающей выборки, Nх - размерность входного сигнала,

N - число синаптических связей.

Число нейронов в скрытом слое двухслойного персептрона или нейронной сети на основе радиальной базисной функции рассчитывается из равенства:

* = N-

Nx + Ny

Согласно формулам оптимальный размер промежуточного слоя составил от 89 до 1565 нейронов. Экспериментируя с числом нейронов в скрытом слое из полученного диапазона значений N и типом сети (RBF или MLP) получили, что минимальное значение квадратичной ошибки на обучающем множестве соответствует сети на основе радиальной базисной функции с 251 элементом в скрытом слое. Процедура контрастирования показала, что была получена минимальная сеть. Ниже представлена таблица параметров построенной в программе STATISTICA модели нейронной сети (таблица 4.12).

Таблица 4.12 - Итоги модели

Архитектура сети Производительность обучения Контрольная производитель-ность Тестовая производитель-ность Ошибки обучения Контрольная ошибка Тестовая ошибка Входы Скрытый слой

РБФ 20:20251-5:1 0,9843 0,9780 0,9767 0,0953 0,1012 0,1047 20 251

В таблице указаны архитектура сети, производительность обучения, контрольная производительность, тестовая производительность, ошибка обучения, контрольная и тестовая ошибки, количество нейронов на входе и в скрытом промежуточном слое.

Архитектура построенной сети представлена на рисунке 4.9. Число слоев в сети 3, промежуточный слой Yj содержит 251 элемент (j = 251). На первом слое Xi -20 нейронов, соответствующих выбранной системе финансовых показателей предприятия (i = 20); на последнем 5, выходной элемент Qk, (k = 5).

Свойства модуля Neural Networks позволило классифицировать наблюдение тестовой выборки с соответствующими уровнями доверия для различных классов, которые представляются уровнями активации выходных нейронов, относящимся к этим классам. Данные значения являются доверительными оценками для выходных классов.

Рисунок 4.9 - Архитектура нейронной сети

На третьем этапе произвели оценку меры производительности сети путем анализа значений матрицы ошибок классификации (таблица 4.13).

Таблица 4.13 - Матрица классификации

Уровни риска кризисного финансового состояния очень низкий низкий средний высокий очень высокий

очень низкий 683 20 0 0 0

низкий 4 1510 29 0 0

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.