Методика применения многомерного шкалирования и кластеризации при анализе кредитоспособности заемщиков тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Костенко, Степан Александрович

  • Костенко, Степан Александрович
  • кандидат науккандидат наук
  • 2013, Краснодар
  • Специальность ВАК РФ05.13.01
  • Количество страниц 144
Костенко, Степан Александрович. Методика применения многомерного шкалирования и кластеризации при анализе кредитоспособности заемщиков: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Краснодар. 2013. 144 с.

Оглавление диссертации кандидат наук Костенко, Степан Александрович

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1 МЕТОДЫ И ПРОГРАММНЫЕ ПРОДУКТЫ ОЦЕНКИ ЭФФЕКТИВНОСТИ ПРЕДПРИЯТИЙ

1.1 Сравнительный анализ существующих методов

1.1.1 Коэффициентный метод

1.1.2 Модель Альтмана

1.1.3 Метод экспертных оценок

1.1.4 Нечетко-множественная модель

1.1.5 Нейронные сети

1.1.6 Дискриминантный анализ

1.1.7 Множественная линейная регрессия

1.1.8 JI огит-модель

1.1.9 Факторный и компонентный анализ

1.1.10 Кластеризация

1.1.11 Многомерное шкалирование

1.1.12 Анализ соответствий

1.1.13 Достоинства и недостатки распространенных методов оценки эффективности

1.2 Обзор программных продуктов

1.1.14 MINISSA

1.1.15 KYST

1.1.16 INDSCAL

1.1.17 ALSCAL

1.1.18 HICLUS

1.1.19 Cluster 3.0

1.3 Выводы по главе 1

ГЛАВА 2 МЕТОДИКА ПРИМЕНЕНИЯ МНОГОМЕРНЫХ МЕТОДОВ

2.1 Системный подход

2.2 Подготовка и обработка исходных данных

2.3 Стандартизация

2.4 Многомерное шкалирование

2.4.1 Метрические методы

2.4.2 Неметрические методы

2.4.3 Определение размерности

2.4.4 Интуитивный уровень и проверка достоверности модели

2.5 Регрессионный анализ

2.6 Кластерный анализ

2.6.1 Метод ближайшего соседа

2.6.2 Полная связь (метод наиболее удаленных соседей)

2.6.3 Невзвешенное попарное среднее

2.6.4 Взвешенное попарное среднее

2.6.5 Невзвешенный центроидный метод

2.6.6 Взвешенный центроидный метод (медиана)

2.6.7 Метод Варда

2.6.8 Двувходовое объединение

2.6.9 Метод К средних

2.7 Выводы по главе 2

ГЛАВА 3 РЕАЛИЗАЦИЯ МЕТОДИКИ ПРИМЕНЕНИЯ МНОГОМЕРНОГО ШКАЛИРОВАНИЯ И КЛАСТЕРИЗАЦИИ

3.1 Многомерное шкалирование

3.2 Регрессионный анализ

3.3 Анализ новых компаний

3.4 Временной разрыв

3.5 Кластерный анализ

3.6 Выводы по главе 3

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЯ

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методика применения многомерного шкалирования и кластеризации при анализе кредитоспособности заемщиков»

ВВЕДЕНИЕ

Актуальность темы. Начало 2000-х годов ознаменовано значительным увеличением объемов цифровой информации в различных дисциплинах, охватывающих биологические, медицинские, физические, экономические и другие смежные науки. В связи с этим темпы развития человеческого понимания получаемой информации зависят от организации процессов систематизации и сжатия большого количества информации. В результате необходима правильная классификация информации.

Все более актуальными становятся разработка и применение новых методик и программных продуктов с целью автоматизации анализа огромных массивов полученных в прошлом и получаемых в настоящем данных. Разработка новых методик, как правило, основывается на применении статистических методов. В основном, это классические статистические методы, включающие алгоритмы классификации, дискриминантного, дисперсионного и регрессионного анализа.

В современных условиях наибольший научный интерес привлекают методы системного анализа. Все чаще системные исследования встречаются в экономике, а именно в деятельности банковских учреждений, так как именно это направление занимает одно из лидирующих мест по доходности. Соответственно в данную область необходимы определенные теоретические, математические и статистические вложения. Сегодня существует острая необходимость в улучшении функционирования кредитного механизма для качественного анализа кредитоспособности заемщиков, что вызвано не достаточно оправданными вложениями кредитных средств в деятельность предприятий.

По причине недостаточности имеющихся знаний, ограниченности во времени, а также не всегда правильного субъективного мнения человека-аналитика, решения в части вложения кредитных средств в экономику очень часто приводят к невозвратам кредитов.

Принимая во внимание сложившиеся обстоятельства на банковском

рынке, в том числе кризис 2008 года в связи с чрезмерным увеличением кредитного портфеля и как следствие этого рост угрозы неплатежеспособности банка актуальна разработка новых методик, позволяющих аналитикам принимать более взвешенные решения о возможности кредитования.

На современном этапе развития банковской системы уже придумано большое количество методов для оценки кредитоспособности заемщиков, как правило, это расчет совокупности показателей экономической эффективности предприятий и в лучшем случае их рейтинговая оценка. Большинство этих методов обладают рядом недостатков, таких как, отсутствие статистического анализа, не всегда верное субъективное мнение аналитика, потеря важных для исследования исходных данных с целью снижения размерности информации и другие. Для исключения возможного искажения окончательного результата предлагается разработать методику, основанную на математическом моделировании с использованием многомерных статистических методов.

Степень разработанности темы. Вопросами развития методов системного анализа, в том числе комплексного применения многомерных методов шкалирования, регрессионного и кластерного анализа занимались К. Адачи, С. Цинца, М. Молинеро, Г. Ларраз, Л. Брейман, Д. Фридман, Ч. Стоун, Р. Олсон и др. В их исследованиях был применен системный подход к формализации проблемы, выбором эффективных методов и средств ее решения. Однако, в России вопросами системного анализа занимались только в части применения многомерных методов шкалирования, регрессионного и кластерного анализа независимо друг от друга.

Целью работы является разработка методики применения многомерных методов шкалирования и кластеризации для определения латентных признаков кредитоспособности заемщика.

Задачи исследования.

1. Применение системного подхода с целью анализа имеющихся

теоретических и практических техник, применяемых в банковской сфере.

2. Разработка методики пошагового выполнения статистических процедур многомерного шкалирования, кластерного и регрессионного анализа для оценки кредитоспособности заемщиков.

3. Апробация методики и её практическое применение на реальных данных заемщиков.

4. Отработка технологии первичной обработки, сбора и стандартизации первичных данных о заемщиках.

5. Оценка достоверности и практической значимости, полученных результатов, на основе данных о заемщике.

Методы исследования.

В диссертационной работе используются методы теории вероятности и прикладной статистики, эконометрики, теории принятия решений в среде STATISTICA 8.0, в том числе с использованием языка STATISTIC A VISUAL BASIC.

Научная новизна исследования заключается в следующих результатах:

- с помощью системного анализа, разработана пошаговая методика, позволяющая использовать многомерное шкалирование, кластерный и регрессионный анализ для оценки финансового состояния потенциальных заемщиков банка, в том числе реализован системный подход для выявления сильных и слабых сторон предприятий. Методика отличается от известных методов пошаговым применением статистических процедур и дает следующие преимущества:

- применение кластерного анализа наряду с многомерным шкалированием позволило нанести на многомерную плоскость контуры, которые в свою очередь упрощают интерпретацию полученной многомерной карты;

- совпадение результатов, полученных как с использованием кластерного анализа, так и с помощью методов многомерного шкалирования доказывает достоверность разработанной пошаговой методики;

- применение регрессионного анализа наряду с многомерными методами шкалирования позволяет установить связь между положением исследуемого объекта и его характеристиками в многомерном пространстве.

Методика структурирования сложных систем практически

апробирована на реальных данных предприятий Краснодарского края и рекомендуется к использованию при принятии решения банками о возможности кредитования компаний. Результаты, полученные с её помощью, совпали с данными о банкротствах, полученных из официальных источников информации по анализируемым организациям, что подтверждает эффективность методики.

Теоретическая значимость состоит в том, что расширен спектр методов анализа таких как модель Альтмана, Давыдовой-Беликова, Чессера и коэффициентный метод. Предлагаемая методика, позволяет прогнозировать экономическое развитие предприятия с большей долей вероятности, чем при использовании существующих методов анализа.

Практическая значимость диссертационной работы. На основе принципов применения статистических многомерных методов предложена методика, позволяющая оперативно сделать вывод о возможности кредитования клиента банка, выявить его сильные и слабые стороны, тем самым, снижая потенциальные убытки банка, связанные с невозвратом кредитных средств. Применение этой методики может использоваться в любом банке в виде внедрения скоринговой информационной системы.

Главным преимуществом перед существующими методами финансового анализа является то, что внедрение предложенной методики полезно как для банков, так и для предприятий. Предприятиям - необходимо знать и давать правильную оценку своего бизнеса, правильно распределять долговую нагрузку, что позволит в дальнейшем получить дополнительное финансирование со стороны кредитных учреждений, а также определить свои сильные и слабые стороны по отношению к конкурентам. В свою

очередь для банков, полученные результаты помогут сформировать качественный кредитный портфель и минимизировать риски, связанные с невозвратностью или несвоевременным погашением основного долга.

На основе предложенной методики создан макрос, разработанный средствами STATISTICA VISUAL BASIC, позволяющий автоматизировать процесс выполнения всех этапов методики, имеющих практическую ценность.

Внедрение результатов. Разработанная методика с использованием многомерного шкалирования и кластерного анализа для оперативного принятия решения использована в качестве модуля ранжирования компаний в Краснодарском филиале ОАО «Банк Москвы».

Основные положения, выносимые на защиту:

1. системный подход с использованием многомерных методов шкалирования и регрессионного анализа для целей визуальной интерпретации связи между положением исследуемого объекта и его характеристиками в многомерном пространстве;

2. методика применения кластерного анализа для решения проблемы объединения объектов в группы на многомерной карте с целью упрощения интерпретации и проверки достоверности результатов, полученных с помощью многомерного шкалирования.

3. результаты апробации разработанной методики на примере предприятий Краснодарского края.

Апробация работы. Результаты диссертационной работы

докладывались на III Международной научной конференции «Технические и технологические системы» (Краснодар, 2011 г.), на VIII Международной научно-практической конференции «Новости научной мысли - 2012» (Чехия, Прага, 2012 г.), на кафедре вычислительной техники и автоматизированных систем управления Кубанского государственного технологического университета (февраль, 2013 г.).

Соответствие содержания диссертации паспорту специальности.

Работа соответствует следующим положениям паспорта ВАК по

специальности 05.13.01 - «Системный анализ, управление и обработка информации»:

1. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации.

2. Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации.

3. Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации.

Публикации.

Основные результаты диссертационной работы опубликованы в 9 научных работах, из них 4 в журналах, рекомендованных ВАК при Минобрнауки России для публикации научных работ.

Имеется свидетельство о государственной регистрации программы для

ЭВМ.

Структура и объем диссертации.

Диссертационная работа состоит из введения, трех глав, заключения и библиографического списка, содержащего 74 наименования, изложенных на 143 страницах, содержит 22 рисунка, 11 таблиц и 3 приложения.

ГЛАВА 1 МЕТОДЫ И ПРОГРАММНЫЕ ПРОДУКТЫ ОЦЕНКИ ЭФФЕКТИВНОСТИ ПРЕДПРИЯТИЙ

1.1 Сравнительный анализ существующих методов

На современном этапе развития компьютерных технологий в разных сферах человеческой деятельности одним из направлений в исследовании явлений является системный подход. Он основывается на изучении сложных систем, состоящих из множества элементов с множеством внутренних и внешних связей. В результате системный анализ можно считать главным универсальным методом анализа сложных экономических, технических, социальных и других систем.

Принимая во внимание вышеизложенное, актуальным является вопрос развития методов системного анализа, а также разработки методики, позволяющей делать прогнозы на основе визуального представления данных. Так, в банковской деятельности довольно остро стоит вопрос о совершенствовании системы кредитования.

Существует достаточно методов, применяемых в анализе кредитоспособности заемщиков и большинство из них используют стандартные методы анализа основных критериев (показателей деятельности предприятия), рассчитываемых исходя из первичных данных бухгалтерской отчетности.

Цель диссертационной работы - разработать методику, которая могла бы отчетливо отразить положение того или иного предприятия на рынке. Данная методика должна обладать универсальностью и её применение не должно ограничиваться экономической сферой деятельности человека.

Перед тем как приступить к описанию предлагаемой методики, необходимо рассмотреть методы, использование которых возможно в банковской деятельности, в том числе методы, основывающиеся на столь популярной в наши дни технологии data mining. Таким образом, будут рассмотрены методы экономического анализа, и методы, основанные на поиске в данных скрытых закономерностей. К методам экономического

анализа можно отнести коэффициентный метод, модель Альтмана, модель Давыдовой-Беликова [12], Чессера [47] и др. К методам data mining относятся такие методы как нечетко-множественная модель, регрессионный и кластерный анализ, факторный и компонентный анализ и другие, рассмотренные в данной главе методы.

1.1.1 Коэффициентный метод

Самым распространенным методом является коэффициентный метод, использующийся в анализе кредитоспособности заемщиков. Идея его состоит в расчете коэффициентов, таких как ликвидность, финансовая устойчивость, рентабельность, деловая активность и других. Совокупность участвующих в анализе коэффициентов может достигать большого числа.

Завершением анализа финансовых коэффициентов, как правило, является рейтинговая оценка деятельности предприятия за различные налоговые периоды и/или в сравнении со среднеотраслевыми показателями. Рейтинговая оценка позволяет на основе выбранного набора коэффициентов провести быстрый комплексный анализ исследуемого предприятия и присвоить рейтинг в зависимости от результатов деятельности.

Устанавливаемые рейтинги могут определяться по разным методикам в различных банках. В основном это бальная оценка, суммирующая набранные баллы по каждому исследуемому коэффициенту, которые рассчитываются согласно общепринятых экономических стандартов, либо устанавливаются субъективно экспертами на основе сложившейся практики работы с клиентами, а также принципов, рекомендуемых Центральным Банком РФ.

1.1.2 Модель Альтмана

Следующим одним из наиболее известных и широко применяемых методов является модель Альтмана[40-43], пришедшая к нам из западной Европы и получившая широкое распространение в России. Эта модель основана на применении мульти-дискриминантного анализа для прогнозирования вероятности банкротства предприятия.

Суть модели состоит в подстановке в формулу (1) набора финансовых показателей компании, имеющих отношение к банкротству на протяжении определенного промежутка времени.

Z = J>, , ,

(О V

где

к, - функции показателей бухгалтерской отчетности,

а, - полученные в результате анализа веса.

Веса, позволяющие оценивать отдельные расчетные показатели, были вычислены на основе применения дискриминантного анализа с использованием данных финансовой отчетности фирм. Выборка состояла из 66 компаний, разделенная на две группы. Первая группа, состоящая из 33 обанкротившихся предприятий, в период с 1956 по 1965 года, средний размер активов, которых составлял 6.4 млн. долл. в диапазоне от 0.7 млн. долл. до 25.9 млн. долл. Вторая группа состояла из производственных предприятий, сгруппированных по отраслям и размерам активов от 1 до 25 млн. долл. Компании из второй группы еще продолжали работать в 1966 году. Данные как в первой так и во второй группах использовались за один и тот же период времени и были получены из финансовой отчетности за год до банкротств.

Согласно методики Альтмана, устанавливались пороговые нормативы z 1 и z2: когда z < z ь риск банкротства предприятия высок, когда z > z2 -риск банкротства низок, z \ < z < z2 - состояние предприятия не определимо. В результате применения метода Альтмана к экономике США, разработанного им в 1968 г., появился индекс кредитоспособности (index of creditworthiness), см. формулу (2).

Z = 0.012^+0.014^2+ О.ОЗЗ.^з + 0.006Х4 + 0.999Х5, (2)

где

хх - отношение собственного оборотного капитала к сумме активов;

х2 - отношение нераспределенной прибыли к сумме активов; - отношение прибыли до уплаты процентов к сумме активов;

х4 - отношение рыночной стоимости собственного капитала к заемному капиталу;

х5 - отношение объема продаж к сумме активов;

2 - обобщенный показатель.

Интервальная оценка Альтмана: при 2 <1.81 - высокая вероятность банкротства, при X >2.67 - низкая вероятность банкротства.

Существуют также и другие методики, такие как модель Давыдовой-Беликова [12], Чессера [47] и др. Но все они в большинстве являются производными от метода Альтмана, более адаптированными к рынку определенной страны.

1.1.3 Метод экспертных оценок

Большой популярностью также пользуется и метод экспертных оценок, базирующийся на экспертном опросе (методом «мозгового штурма») с последующей обработкой данных методами статистики. Так, представителями указанной теории являлись Марковича (портфельная теория) [62-64], Шарп-Литнер (теория линии рынка капитала) [35, 68-70]. Классическая мера риска по Марковичу - это среднеквадратическое отклонение распределения доходности актива.

1.1.4 Нечетко-множественная модель

Более гибкой и достоверной является нечетко-множественная модель, предложенная Алексеем Недосекиным [22] с целью решения экономических задач. Модель состоит из выполняемых последовательно следующих процедур:

- выбирается система финансовых показателей Xi на усмотрение эксперта;

- сопоставляется каждому показателю X; уровень значимости ^ по формуле (4) или (5). Чтобы оценить этот уровень, нужно расположить все показатели по порядку убывания значимости так, чтобы выполнялось правило (3). Если система показателей проранжирована в порядке убывания

их значимости, то уровень значимости ¿-го показателя следует определять по правилу Фишберна [33] согласно формулы (4). Если же все показатели обладают равной значимостью (равнопредпочтительны или системы предпочтений нет), тогда уровень значимости следует определять по формуле (5);

г,>г2>...^, (3)

- ¡ + 1)

Г, =-

(4)

г,=Ш, (5)

где

г,, г,, г2, - уровни значимости показателя, ы- количество показателей.

- определяется лингвистическая переменная «Уровень показателя X» с терм-множеством значений «Очень низкий, Низкий, Средний, Высокий, Очень высокий». Для описания подмножеств терм-множества вводится система из пяти функций принадлежности трапецеидального вида. В результате выполнения которой, формируются критерии разбиения, см. табл. 1;

Таблица 1 - Классификация значений показателей

Наименование показателя Очень низкий Низкий Средний Высокий Очень высокий

х, Х]<Ьц Ьц<Х1<Ь|2 Ь)2< Х]<Ь]3 Ь]3<Х)<Ь]4 Ь|4< X]

х, х,<Ь,1 Ь11<Х,<Ь,2 Ь,2< Х,<Ь,з Ь,3< Х,<Ь,4 Ь,4< X,

Хк хм<Ьш Ьм1< Хы<Ьы2 Ьн2< Х(ч|<Ь)\|3 Ьыэ< Хм<Ьн4 Ь|Ч)4< Хм

- производится классификация текущих значений X по критерию таблицы 1. Результатом проведенной классификации является таблица 2, где (уровень принадлежности показателя х, нечеткому подмножеству Ь,_,) равен единице, если Ь^.^х^Ьу, и нулю в противоположном случае (когда значение не попадает в выбранный диапазон классификации);

- производятся формальные арифметические действия по построению комплексного финансового показателя, выполнив двойную свертку согласно формуле (6).

Таблица 2 - Классификация уровня показателей

Наименование показателя Очень низкий Низкий Средний Высокий Очень высокий

X, Х\2 А-14 Х-15

* . » . . . * . •

* ^¡2 ^¡3 Х.,4 ^¡5

, , ,

Хк А,м1 ^N2 А,нз ^N4 ^N5

5 N

е = (6)

j=l 1=1

где

^ = 0.9-0.20-1), (7)

Х1} - уровень принадлежности,

^, - уровень значимости показателя,

N - количество показателей.

В отличие от модели Альтмана и от ее производных, метод нечетких множеств, предложенный Недосекиным, основывается не на априорно заданных коэффициентах, а использует интуицию и опыт эксперта — финансового аналитика, досконально знающего сильные и слабые места оцениваемого предприятия. Применение метода дает хорошие результаты, благодаря учету особенностей предприятий, которые отражаются в выбранной системе показателей.

1.1.5 Нейронные сети

В качестве одного из методов анализа кредитоспособности заемщика возможно использование нейронных сетей, идея которых возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном

опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с известными показателями платежеспособности, ликвидности, оборачиваемости и др.) конструировать структуру, состоящую из нейронов и связей, предназначенную для отнесения потенциального заемщика к одному из классов ("надежные заемщики" или "проблемные заемщики").

Примером использования нейронных сетей является программно-алгоритмическое обеспечение дискриминантного анализа (применение модели Альтмана) в финансовом анализе. В 1995 году D. Trigueños и R.T. Taffler [73] была предложена достаточно точная модель с использованием нейронных сетей в бухгалтерском учете и финансовом анализе.

1.1.6 Дискриминантный анализ

Дискриминантный анализ - это статистический метод, позволяющий изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Метод связан с получением одной или нескольких функций, обеспечивающих отнесение объекта к одной из групп.

Функция линейного дискриминантного анализа имеет следующий вид:

fkm = u0 + ulXlkm + u2X2km + ■•• + upXpkm > (8)

где

fkm — значение дискриминантной функции для ш-го объекта в группе к,

xjkm - значение дискриминантной переменной X¡ для т-го объекта в группе к,

u¡ - коэффициенты, обеспечивающие выполнение требуемых условий. Коэффициенты u¡ выбираются таким образом, чтобы их средние значения для различных классов как можно больше отличались друг от друга. Примером такой функции может служить модель Альтмана, представленная функцией (2) с пятью показателями.

Решение задачи дискриминантного анализа сводится к решению трех проблем:

- определение оптимального множества характеристик объектов, значения которых максимально распределяют объекты по классам;

- с помощью этих характеристик, идентификация критериев, при помощи которых могут быть классифицированы объекты по группам;

- использование оптимального множества характеристик и критериев для определения групп, к которым принадлежат или будут принадлежать новые объекты, принадлежность которых заранее неизвестна.

Таким образом, метод решает задачу интерпретации, которая связана с определением числа и значимости канонических дискриминантных функций и с выяснением их значений для объяснения различий между классами.

1.1.7 Множественная линейная регрессия

Задачей множественной линейной регрессии является построение линейной модели связи между набором непрерывных предикторов и непрерывной зависимой переменной с использованием регрессионного уравнения (9).

п

У=1а,Х; + Ь0+е, (9)

¡=1

где

а— регрессионные коэффициенты,

ь0— свободный член,

е - член, содержащий ошибку.

1.1.8 Логит-модель

Вслед за предложением использования дискриминантного и регрессионного анализа последовало предложение [65] об использовании логит-модели, которая была менее требовательна к структуре данных. Логит-модель - это нелинейная модель, при помощи которой после логит трансформации, полученный результат всегда находится в интервале от 0 до 1 и представлена функцией (10).

еЬ0 + Ь,х,+Ь2х2+ +Ь„х„

У ~ ]+еЬо + Ь|Х,+Ь2х2+ +Ьпх„ ' (Ю)

Если полученное значение функции для одного объекта равно или близко к одному экстремальному значению из двух возможных, то объект классифицируется как принадлежащий к тому классу, которому соответствует то значение.

1.1.9 Факторный и компонентный анализ

Методами факторного и компонентного анализа решаются три основных вида задач:

- отыскание скрытых, но предполагаемых закономерностей, которые определяются воздействием внутренних или внешних причин на изучаемый процесс;

- выявление и изучение статистической связи признаков с факторами или главными компонентами;

- сжатие информации путем описания процесса при помощи общих факторов или главных компонент, число которых меньше количества первоначально взятых признаков (параметров), однако с той или иной степенью точности обеспечивающих воспроизведение корреляционной матрицы.

Факторный анализ, по сути, исследует внутреннюю структуру матриц ковариаций и корреляций. При анализе структуры ковариационных матриц чаще всего применяют два подхода, формально до некоторой степени похожих друг на друга, однако различных по целям. Одним из них является метод главных компонент (компонентный анализ) и другой - факторный анализ.

В факторном анализе основным предположением является равенство в виде линейной комбинации г факторов, см. уравнение (11).

= (11) Г=1

где

1 = 1,2, •■•> Р

^ - г-й простой фактор,

к - точно задано,

е, - остатки, которые представляют источники отклонений, действующие только нах,,

11Г - нагрузка г-го фактора в ьй переменной, 11Г считается обычно неизвестным параметром и подлежит оценке.

Основным предположением факторного анализа является, что множество наблюдаемых коррелированных переменных х, (1=1, 2, ..., р) можно описать меньшим числом гипотетических переменных или простых факторов ^ (г=1, 2, ..., к) и множеством р независимых остатков.

В анализе главных компонент основным является уравнение (12).

р

= (12) Г = 1

где

г = 1, 2, ..., р,

гг - г-я компонента,

\у1Г - вес г-й компоненты в ¿-й переменной.

Если сравнивать уравнения (11) и (12), можно увидеть, что здесь не рассматривается никаких остатков е,, поскольку полная дисперсия переменных в компонентном анализе исчерпывается, когда учтены все р компонент.

В случае нахождения факторных нагрузок и компонентных весов, соответствующих совокупности гипотетических переменных, следующим шагом является попытка их интерпретации, при которой исходные данные имеют вполне разумное объяснение.

На первый взгляд факторный анализ похож на ранее описанный дискриминантный анализ, однако есть существенное отличие факторного анализа от дискриминантного. Заключается оно в том, что в дискриминантном анализе определяется разделение точек, причем заранее

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Костенко, Степан Александрович, 2013 год

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. Адамов В.Е. Факторный индексный анализ. - М.: Статистика, 1997г.

2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. -М.: Финансы и статистика, 1983г., -472 с.

3. Айвазян С.А., Бежаева З.И. Староверов О.В. Классификация многомерных наблюдений. -М., 1974г.

4. Андрукович П.Ф. Сравнение моделей одномерного и многомерного шкалирования. - В кн.: Статистические методы анализа экспертных оценок. -М., 1977г.

5. Бернстайн Л.А. Анализ финансовой отчетности. - М.: Финансы и статистика, 1996г.

6. Боровиков А.А. Математическая статистика. -М.: Наука, 1984г., -472 с.

7. Боровиков А.А. Теория вероятностей. М., Эдиториал УРСС, 1999 г.

8. Боровиков В. STATISTIC А. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. -Спб.: Питер, 2003г., - 688 с.

9. Владимирский. Б.М. Нейронные сети как источник идей и инструмент моделирования процессов самоорганизации и управления // Экономический вестник Ростовского государственного университета. 2006г., т. 4., №4., с. 142-144.

10. Воронцов К.В. Лекции по алгоритмам кластеризации и многомерного шкалирования. -М. 2007. - 18с.

11. Гунин Г.А. Особенности практического применения искусственных нейронных сетей к прогнозу финансовых временных рядов. - В кн.: Экономическая кибернетика: системный анализ в экономике и управлении. - СПб, СПбУЭФ, 2001г.

12. Давыдова Г.В., Беликов А.Ю. Методика количественной оценки риска банкротства предприятий // Управление риском, 1999 г., № 3, с. 13-20.

13. Дебок Г., Кохонен Т. Анализ финансовых данных с помощью самоорганизующихся карт: Пер. с англ. М.: Издательский дом «

Альпина», 2001г., - 230 с.

14. Дейвисон М. Многомерное шкалирование. -М. 1988г.

15. Ежов A.A., Шумский С.А. Нейрокомпьютинг и его приложения в экономике и бизнесе. М.: МИФИ, 1998г., - 222 с.

16. Каменский B.C. Методы и модели неметрического многомерного шкалирования (обзор) // Автоматика и телемеханика. —М. 1977г., №8, с. 118-156.

17. Ким О., Мьюллер Ч.У., Клекка У.Р. и др.; Под ред. Енюкова И.С. Факторный, дискриминантный и кластерный анализ. -М.: Финансы и статистика, 1989г., - 215 с.

18. Косолапов М.С. Неметрическое многомерное шкалирование: постановка задач и алгоритмы их решения // Многомерный анализ социологических данных.-М., 1981г., с. 74-117.

19. Краскел Д.Б. Многомерное шкалирование и другие методы поиска структуры // Статистические методы для ЭВМ. - М.: Наука, 1986. с. 301-347.

20. Лоули Д., Максвелл А. Факторный анализ как статистический метод. -М., 1967г., 144 с.

21. Мандель И. Д. Кластерный анализ. -— М.: Финансы и Статистика, 1988г.

22. Недосекин А.О., Максимов О.Б. Применение теории нечетких множеств к финансовому анализу предприятий // 1999. - На сайтах:

URL: http://www.vmgroup.sp.ru/, cfin.ru/analysis, URL: http://www.delovoy.newmail.ru/analitic/3.htm

23. Окунь Я. Факторный анализ. -М., 1974г., 200с.

24. Песаран М., Слейтер Л. Динамическая регрессия: теория и алгоритмы. -М.: Финансы и статистика, 1984г., -310 с.

25. Позднякова А. Дискриминантный анализ и другие многомерные

методы в маркетинговых исследованиях / CIU (Consumer Insights Ukraine). Киев.

26. Терехина А.Ю. Методы многомерного шкалирования и визуализации данных (обзор) // Автоматика и телемеханика. -М., 1973г., №7, с. 80-94.

27. Терехина А. Ю. О двух задачах индивидуального многомерного шкалирования // Автоматика и телемеханика, -М., 1974г., № 4, с. 135142.

28. Терехина А. Ю. Многомерный анализ субъективных данных о сходствах или различиях. Препринт, ВНИИСИ, -М., 1978г.

29. Толстова Ю.Н. О возможности применения евклидова расстояния при использовании различных шкал. - Тез. докл. на Межреспубл. науч. конф. по применению мат. методов в исслед. учеб, процесса. Вильнюс, 1977г.

30. Уиллиамс У. Т., Ланс Д. Н. Методы иерархической классификации // Стати- стические методы для ЭВМ // Под ред. М. Б. Малютов. — М.: Наука, 1986г., с. 269-301.

31. Уоссермен Ф. Нейрокомпьютерная техника: теория и практи- ка. - М.: ЮНИТИ, 1992.-240 с.

32. Федосеев В.В., Гармаш А.Н., Дайитбегов Д.М. Экономико-математические методы и прикладные модели: Учебное пособие для ВУЗов / Под ред. В.В. Федосеева. - М.: ЮНИТИ, 1999. - 391 с.

33. Фишберн П. Теория полезности для принятия решений. М.: Наука, 1978.

34. Халафян A.A. STATISTICA 6. Статистический анализ данных. 3-е изд. Учебник. -М.: ООО «Бином-Пресс», 2007г., - 512 с.

35. Шарп У., Александр Г., Бейли Дж. Инвестиции. - М.: Инфра-М, 1997г.

36. Эйтингон В., Анохин С. Прогнозирование банкротства: основные методики и проблемы. URL: http://crisis.engec.ru/bankrot5.htm.

37. База данных контрагент. URL: http://www.k-agent.ru.

38. Финансовый портал СКРИН. URL: http://www.skrin.ru.

39. Интернет-ресурс Арбитражного суда Краснодарского края. URL: http://krasnodar.arbitr.ru.

40. Altman E.I. Financial Ratios, Discriminant Analysis and Prediction of Corporate Bankruptcy // The Journal of Finance, September 1968, pp. 589609.

41. Altman E.I. Corporate Financial Distress. - New York, John Wiley, 1983.

42. Altman E.I. Futher Empirical Investigation of the Bankruptcy Cost Question // The Journal of Finance, September 1984, pp. 1067-1089.

43. Altman E.I. personal internet homepage. - On site: http://pages.stern.nyu.edu/~ealtman/index.html.

44. Caroll J.D., Chang J.-J. Analysis of individual differences in multidimensional scaling via N-way generalization of «Ekart-Young» decomposition // Psychometrika, Vol. 35, 1970. pp. 283-319

45. Carroll J.D. Individual differences and multidimensional scaling. In R. N. Shepard, A.K. Rommey, & S. Nerlove (Eds.). Multidimensional scaling: Theory and applications in the behavioral sciences // New York: Academic Press. Vol. I, 1972.

46. Chatfield. C. and Collins A.J. Introduction to Multivariate Analysis // Chapman and Hall, London, UK, 1980.

47. Chesser D.L. Predicting Loan Noncompliance // The Journal of Commercial Bank Lending, 56(12), 1974, 28-38.

48. Coats P.K, Fant L.F. Recognizing financial distress patterns using a neural tool // Financial Management. Vol. 22(3), 1993, pp. 142-155.

49. Espahbodi H., Espahbody P. Binary choice and corporate takeover // Journal of Banking and Finance, Vol. 27 (4), 2003, pp. 549-574.

50. Ezzamel M. and Mar Molinero С. On the Distributional Properties of financial Ratios // Journal of Bussiness Finance and Accounting, Vol. 14, 1987, pp. 81-463.

51. Green P.E. Mathematical tools for applied multivariate analysis // New York: Academic Press, 1978.

52. Guttman L. A general nonmetric technique for finding the smallest space coordinate space for a configuration of points // Psychometrika, Vol. 33, 1968, pp. 469-504.

53. Hohn F.E. Elementary matrix algebra (3rd ed.). New York: MacMillan, 1973.

54. Jagtiani J., Kolari J., Lemieux C., Shin H. Early warning models for bnk supervision: Simper could be better, Federal Reserve Bank of Chicago. // Economic Perspectives, Vol. 27(3), 2003, pp. 49-60.

55. Johnson S.C. Hierarchical clustering schemes // Psychometrika, Vol. 2, 1967, pp. 241-254

56. Kolari J., Glennon D., Shin H. & Caputo M. Predicting large U.S. commercial bank failures // Journal of Economics and Business, 54, 2002, pp. 361-387.

57. Kruskal J.B. Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis // Psychometrika, Vol. 29, 1964, pp. 1-27, 115-129.

58. Kruskal J.B. Nonmetric multidimensional scaling: a numerical method // Psychometrika, Vol. 29, 1964, pp. 115-130.

59. Kruskal J.B., Young F.W., Seery J.B. How to use KYST2-A: a very flexible program to do multidimensional scaling and unfolding // Unpublished manuscript, AT&T Bell Laboratories, Murray Hill, NJ, 1977 (http://www.netlib.org/mds/kyst2a_manual.txt).

60. Lin T.-H. A cross model study of corporate financial distress predictin in Taiwan: Multiple discriminant analysis, logit, probit and neural network models //Neurocomputing, doi:10.1016/j.neucom.2009.02.018, 2009.

61. Lo A.W. Logit Versus Discriminant Analysis: A Specification Test and Application to Corporate Bankruptcies // Jornal of Econometrics, Vol. 31, 1986, pp. 78-151.

62. Markowitz H.M. Portfolio Selection // Journal of Finance, March 1952, pp. 77-91.

63. Markowitz H.M. Portfolio Selection. - Yale Univercity Press, 1959.

64. Markowitz H.M. personal Internet homepage. - On site: http://cepa.newschool.edu/het/profiles/markow.htm.

65. Ohlson J. Financial Ratios and the Probabilistic Prediction of Bankruptcy // Journal of Accounting Research, Vol. 18, No. 1, 1980, pp. 109-131.

66. Richardson F.M. and Davidson L.F. An Exploration Into Bankruptcy Discriminant Model Sensitivity // Journal of Business finance and Accounting, Vol. 10, No. 2, 1983, pp. 195-207.

67. Roskam E.E., Lingoes J.C. MINISSA-1: a FORTRAN IV (G) program for the smallest space analysis of square symmetric matrices // Behavioral Science, Vol. 15, 1970, pp. 204-205.

68. Sharpe W.F. A Simplified Model of Portfolio Analysis // Management Science, January 1963.

69. Sharpe W.F. personal Internet homepage. - On site: http ://www. Stanford .edu/-wfsharpe/home. htm.

70. Sharpe W.F. Sharpe Ratio. - On site: http:// www. Stanford .edu/~wfsharpe/art/sr/sr. htm.

71. Schiffman S.S., Reynolds M.L., Young F.W. Introduction to multidimensional scaling // London: Academic Press, 1981.

72. Torgerson W.S. Multidimensional scaling: I. Theory and method. Psychometrika 17, 1952, pp. 401-419. Русский перевод: Торгерсон У.С. Многомерное шкалирование: Теория и метод // Статистическое измерение качественных характеристик. -М.: Статистика, 1972, с. 95118.

73. Trigueños D. and Taffler R.T., Neural networks and empirical research in accounting, Working Paper, The City University Business School, London, 1995.

74. Ward J.H. Hierarchical grouping to optimize an objective function, J. Amer. Statist. Assoc., Vol. 58, 1963, pp. 236-244.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.