Разработка математических моделей, алгоритмов и программ прогнозирования платежеспособности по кредитам тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Шунина Юлия Сергеевна

  • Шунина Юлия Сергеевна
  • кандидат науккандидат наук
  • 2016, ФГБОУ ВО «Ульяновский государственный университет»
  • Специальность ВАК РФ05.13.18
  • Количество страниц 149
Шунина Юлия Сергеевна. Разработка математических моделей, алгоритмов и программ прогнозирования платежеспособности по кредитам: дис. кандидат наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. ФГБОУ ВО «Ульяновский государственный университет». 2016. 149 с.

Оглавление диссертации кандидат наук Шунина Юлия Сергеевна

Введение

Глава 1. ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ

1.1. Прогнозирование платежеспособности клиентов как основная задача для обеспечения возврата кредитов

1.2. Предварительная обработка данных по клиентам

1.3. Модели и методы прогнозирования возврата кредитов при решении вопроса о выдаче кредита

1.3.1. Регрессионные модели

1.3.2. Модели дискриминантного анализа

1.3.3. Метод нейронных сетей

1.3.4. Дерево принятия решений

1.3.5. Метод опорных векторов

1.3.6. Метод ближайших соседей

1.3.7. Байесовский подход

1.3.8. Ансамбли моделей

1.3.9. Рейтинговые и балльные модели

1.4. Методы прогнозирования возврата кредитов при погашении кредита

1.5. Используемое программное обеспечение

1.6. Критерии качества методов прогнозирования

1.7. Постановка задач исследования

Глава 2. РАЗРАБОТКА МОДЕЛЕЙ И АЛГОРИТМОВ ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ НА ОСНОВЕ АДАПТИВНЫХ АГРЕГИРОВАННЫХ МЕТОДОВ КЛАССИФИКАЦИИ И МАРКОВСКИХ ЦЕПЕЙ

2.1. Формальная постановка задачи

2.2. Моделирование и прогнозирование выдачи кредитов

2.2.1. Построение агрегированных методов классификации

2.2.2. Нахождение порога классификации клиентов на классы

2.2.3. Обновление агрегированных методов классификации на основе псевдоградиентной процедуры

2.3. Моделирование и прогнозирование погашения кредитов

2.3.1. Математические модели динамики погашения кредита на основе марковских цепей

2.3.2. Оценивание матриц переходных вероятностей

2.4. Выводы и рекомендации

Глава 3. АЛГОРИТМЫ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ

3.1. Алгоритм прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации

3.2. Алгоритм прогнозирования возврата выданных кредитов на основе моделей динамики погашения кредита

3.3. Программный комплекс прогнозирования возврата кредитов

3.3.1. Назначение программного комплекса

3.3.2. Проектирование программного комплекса

3.3.3. Структура программного комплекса

3.3.4. Реализация программного комплекса

3.4. Выводы и рекомендации

Глава 4. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ И ЧИСЛЕННОЕ ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ

4.1. Методика проведения экспериментальных исследований

4.2. Прогнозирование возврата кредитов при решении вопроса о выдаче кредита

4.2.1. Описание исходных данных

4.2.2. Предварительная обработка данных по клиентам

4.2.3. Анализ эффективности прогнозирования возврата кредитов при решении вопроса о выдаче кредита

4.3. Прогнозирование возврата кредитов при погашении кредита

4.3.1. Описание исходных данных

4.3.2. Предварительная обработка данных по заемщикам

4.3.3. Анализ эффективности прогнозирования возврата кредитов при погашении кредита

4.4. Выводы

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

Введение

Кредитование клиентов - основной вид деятельности любого кредитного учреждения. Доходы от обслуживания клиентов составляют значительную часть прибыли, при этом неизбежно появление различных видов рисков, приводящих к потерям и убыткам. Ключевой задачей при управлении кредитными рисками, как на этапе выдачи кредита, так и на этапе его погашения является прогнозирование платежеспособности клиентов для обеспечения возврата кредитов.

Согласно положению Центрального Банка Российской Федерации оценка финансовых характеристик заемщика основывается на методах, установленных внутренней политикой кредитной организации. При решении вопроса о выдаче кредита, когда требуется оценить кредитоспособность клиента, то есть степень соответствующего риска, распространены рейтинговые, балльные модели, а также методы машинного обучения, к которым относятся использование логистической модели, дискриминантного анализа, байесовского классификатора, нейронных сетей, деревьев решений, ансамбли моделей и другие. Нет универсальной модели, с помощью которой можно было бы спрогнозировать возврат кредитов с явным преимуществом.

Обеспечение возврата выданных кредитов требует учета различных факторов, которые могут иметь влияние на изменение платежеспособности заемщиков и возникновение просроченной задолженности по кредиту. В ряде работ рекомендуется использование аппарата марковских цепей.

Методы прогнозирования возврата кредитов, применяемые в банках в настоящее время, не всегда обеспечивают необходимую точность, особенно в изменяющихся экономических условиях, когда требуется оперативно корректировать используемую модель.

С появлением кредитных бюро и накоплением множества данных о кредитовании клиентов в различных кредитных организациях появилась база для разработки более совершенных методов прогнозирования

возврата кредитов. Вместе с тем развитие информационных технологий предоставляет все более мощные средства для реализации сложных методов и алгоритмов.

Кроме того, рост задолженностей и невозврата по кредитам, а также конкуренция на рынке кредитных услуг требуют совершенствования имеющихся методик прогнозирования возврата кредитов с целью более точной оценки кредитного риска, что предопределило актуальность данной работы.

Объектом исследования в диссертационной работе являются заемщики банковских организаций.

Предмет исследования - математические модели, алгоритмы и соответствующие программы для прогнозирования возврата кредитов.

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка математических моделей, алгоритмов и программ прогнозирования платежеспособности по кредитам»

Цель работы

- повышение точности прогнозирования возврата кредитов в банковской сфере за счет использования программных средств на основе адаптивных агрегированных методов классификации и марковских цепей.

Для достижения поставленной цели решаются задачи:

- разработка метода прогнозирования возврата кредитов на основе агрегированных методов классификации, обеспечивающего повышение точности прогнозирования при решении вопроса о выдаче кредита;

- построение процедур обновления параметров моделей, используемых при классификации, для учета вновь поступающих данных о клиентах;

- разработка модели динамики погашения кредита с учетом информации о заемщике, его кредитной истории, а также условий предоставления кредита;

- разработка метода прогнозирования изменения платежеспособности заемщиков на основе модели динамики погашения кредита, разделяющего заемщиков на группы с целью определения

мероприятий по работе с заемщиками, имеющими задолженность и обеспечения возврата кредитов;

- разработка алгоритмов и программ для прогнозирования возврата кредитов при решении вопроса о выдаче кредита, а также при погашении кредита;

- компьютерное моделирование и исследование эффективности предложенных подходов.

Научной новизной обладают впервые предложенные адаптивные агрегированные методы классификации клиентов на классы, использующие различные методы машинного обучения; новые модели динамики погашения кредита, интегрирующие марковские цепи 1 -го и 2-го порядка для учета кредитной истории заемщика и методы машинного обучения; алгоритмы агрегации и интеграции указанных методов; а также разработанный на их основе программный комплекс для прогнозирования возврата кредитов.

Теоретическая значимость работы состоит в разработке новых адаптивных агрегированных методов классификации и модификации моделей динамики погашения кредита, а также новых алгоритмов агрегации и интеграции методов для прогнозирования возврата кредитов, обеспечивающих более высокую точность.

Практическая значимость работы заключается в том, что разработанный программный комплекс на основе предложенных алгоритмов повышает точность прогнозирования возврата кредитов, и может быть использован кредитными учреждениями для поддержки принятия решений в процессе кредитования клиентов с целью снижения уровня задолженности и обеспечения возврата средств по кредитам.

Методы исследования. Решение поставленных задач осуществлялось с использованием методов теории вероятностей и математической статистики, статистического моделирования, методов

машинного обучения, марковских цепей и численных методов. В основу разработки программного комплекса легли методы объектно-ориентированного проектирования программных систем.

Основные научные положения, выносимые на защиту:

1) Алгоритм прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации, обеспечивающий повышение точности прогнозирования.

2) Способ численного обновления параметров моделей, используемых в агрегированных методах классификации, на основе псевдоградиентной процедуры.

3) Модифицированные математические модели динамики погашения кредита на основе марковских цепей и методов классификации, позволяющие учитывать состояние кредитной истории, а также условия кредита и информацию о заемщике.

4) Алгоритм прогнозирования изменения платежеспособности заемщиков, основанный на выборе наилучшей модели динамики погашения кредита для каждого перехода из одного состояния кредитного счета в другое.

5) Программный комплекс, реализующий разработанные алгоритмы, для поддержки принятия решений в процессе кредитования клиентов.

Достоверность. Достоверность положений диссертации обеспечивается корректностью выбранных математических методов и подтверждается результатами статистических испытаний, а также эффективностью работы алгоритмов и программ при внедрении.

Реализация и внедрение результатов работы. Диссертационная работа выполнялась при поддержке гранта по Федеральной целевой программе "Научные и научно-педагогические кадры инновационной России" (соглашение 14.B37.21.672) и гранта Российского фонда фундаментальных исследований по проекту №15-48-02038. По

результатам работы получено звание лауреата конкурса научно-технического творчества молодежи Приволжского федерального округа (2015 г.) и медаль «За успехи в научно-техническом творчестве и научно-исследовательской работе».

Результаты исследования внедрены для прогнозирования возврата кредитов при решении вопроса о выдаче кредитов, а также погашения по текущим платежам в практику деятельности ПАО Банк ВТБ 24 (филиал №6318 в г. Казани), и планируются к внедрению в консалтинговой компании ООО «Блэк Пайн» (г. Москва) (соответствующие акты прилагаются).

Результаты диссертационной работы также используются в учебном процессе Ульяновского государственного технического университета в дисциплинах «Финансовая и страховая математика», «Спецкурс по финансовой математике», «Статистическое моделирование» и «Математические модели в экономике», читаемых студентам, обучающимся в бакалавриате и магистратуре по направлению «Прикладная математика» (справка прилагается).

Апробация работы. Теоретические положения и практические результаты работы докладывались на ежегодных научно-технических конференциях Ульяновского государственного технического университета в 2013 - 2015 г.г., на XII Всероссийском совещании по проблемам управления в Институте проблем управления им. В.А. Трапезникова Российской академии наук (Москва, 2014 г.), научно-практической ^егие^ конференции «Междисциплинарные исследования в области математического моделирования и информатики» (Тольятти, 2014 г.), международной научно-практической конференции «Региональная экономика: актуальные вопросы и новые тенденции» (Ульяновск, 2014 г.), международной научно-практической конференции «Молодёжный форум: технические и математические науки» (Воронеж, 2015 г.), Российской научно-технической конференции аспирантов, студентов и молодых

ученых «Информатика и вычислительная техника» (Ульяновск, 2015 г.), Всероссийской школе-семинаре аспирантов, студентов и молодых ученых "Информатика, моделирование, автоматизация проектирования" (Ульяновск, 2015 г.) и других.

Публикация результатов работы. Результаты исследований по теме диссертации изложены в 20 научных работах (из них 8 статей без соавторов), в том числе в шести статьях в журналах из перечня рецензируемых научных изданий, рекомендованных ВАК Минобрнауки РФ. Получены два свидетельства о государственной регистрации программ для ЭВМ.

Личный вклад автора. Постановка задач исследования осуществлялась научным руководителем. Все основные теоретические и практические исследования проведены автором диссертационной работы самостоятельно.

Глава 1. ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ ВОЗВРАТА

КРЕДИТОВ

1.1. Прогнозирование платежеспособности клиентов как основная задача для обеспечения возврата кредитов

Под платежеспособностью понимают способность юридического или физического лица - заемщика - выполнять свои обязательства в полном объеме в установленные сроки, как денежными средствами, так и другими видами активов [19]. Прогнозирование - это предсказание будущего с использованием научных методов. Таким образом, прогнозирование платежеспособности означает прогноз или оценку способности юридического или физического лица выполнять свои обязательства в полном объеме с помощью методов и моделей, адекватно описывающих данный процесс.

В области кредитования задача прогнозирования платежеспособности потенциального заемщика кредитной организацией возникает впервые при подаче клиентом заявки на получение кредита в виде анкеты [34, 37, 51]. Следовательно, платежеспособность ограничивается определением способности лица выполнить кредитные обязательства в полном объеме в установленный срок, что составляет суть взаимосвязанного понятия - «кредитоспособность». На данном этапе кредитования банк заинтересован в возвращении выданных сумм с процентами, поэтому при решении вопроса о выдаче кредита требуется оценить кредитоспособность клиента, то есть степень соответствующего риска.

На практике прогнозирование возврата кредитов при решении вопроса о выдаче кредита или оценка кредитоспособности потенциального заемщика кредитной организацией получило название «кредитный скоринг» [66-67], а модель, на основе которой выполняется оценка -«скоринговая модель» [20-21, 23, 31, 38, 63, 82, 85]. Поэтому оценка

кредитоспособности клиентов на этапе получения кредита известна также как анкетный скоринг (аррНсайоп-скоринг) [59, 65].

Для решения данной задачи кредитору необходимо с наибольшей точностью определить способность клиента полностью и в срок погасить кредит на основе финансовых, социальных, демографических и других данных, известных о клиенте. Другими словами, требуется найти функциональную зависимость между возвратом кредита клиентом и набором признаков, известных о клиенте, то есть определить некую модель прогнозирования [77].

С точки зрения статистической теории принятия решений задачу прогнозирования возврата кредитов при решении вопроса о выдаче кредита можно рассматривать как задачу классификации клиентов на классы кредитоспособности [2, 24]. Под классами кредитоспособных и некредитоспособных клиентов понимаются группы клиентов, способных вернуть кредит и не способных выполнять обязательства по кредиту соответственно.

Как правило, модель прогнозирования строится на основе информации о «старых» клиентах, по которым известно: вернули они кредит или нет (кредитоспособные или некредитоспособные). При этом основная цель заключается в получении модели, для которой отклонение реального значения от прогнозируемого стремится к минимуму. После того, как модель определена, требуется спрогнозировать возврат кредитов «новыми» клиентами.

Набор признаков, как правило, представляет собой данные из анкет, которые заполняются при подаче заявки на кредит. Поскольку в положении Центрального Банка (ЦБ) РФ указывается лишь примерная информация для оценки заемщика, существуют различные формы анкет. Основной набор признаков: ФИО, паспортные данные, дата рождения, образование, адрес, семейное положение, ФИО и дата рождения родственников, сведения об основной работе, ежемесячные доходы и

расходы, информация об имеющемся имуществе, информация об имеющихся долгах, обязательствах, информация об инвалидности, запрашиваемая сумма и т.д.

Помимо данных из анкеты, в случае, если клиент уже брал кредит в прошлом или имеет кредит в настоящее время, признакам могут являться также данные о кредитной истории, полученные из кредитного бюро посредством запроса [7]. Возможно несколько вариантов представления информации о кредитной истории. В первом случае, это может быть обобщенное решение: положительная кредитная история, либо отрицательная кредитная история. Отрицательной историей, как правило, считается история при задержке платежей сроком на три и более месяца. В другом случае признакам могут являться все данные, полученные из кредитного бюро.

Следует отметить, что один и тот же набор признаков может быть дан как кредитоспособным, так и некредитоспособным клиентом, поэтому принципиально невозможно достигнуть абсолютно точной классификации.

Согласно указанному положению ЦБ РФ финансовые характеристики заемщика в целом оцениваются как хорошие, средние или плохие. При этом нет четких определений данной градации. Среди исследовательских работ в качестве выходной информации в основном используется два класса кредитоспособности. Однако столь жесткое разделение может привести к потере клиентов, которым можно было бы предложить другие условия при получении кредита, например, меньший срок, более высокий процент и т.п. Поэтому в диссертационной работе в качестве выходной информации предлагается использовать не только класс кредитоспособности, но и вероятность возврата кредита. Например, в случае двух классов при распределениях вероятностей возврата кредита 95%/5% и 60%/40% клиент вернет кредит в обоих случаях, но с очевидной разницей.

Поскольку при прогнозировании возврата кредитов при решении вопроса о выдаче кредита лежат статистические законы, то возможно появление различных ошибок, в результате которых либо кредитная организация теряет свои деньги, либо клиент незаслуженно остается без кредита. Возникает необходимость решить одновременно две задачи: с одной стороны, минимизировать пропуск некредитоспособных клиентов, а с другой стороны максимизировать выдачу кредитов кредитоспособным клиентам. Для решения необходимо найти оптимальный порог классификации (точку отсечения) - значение вероятности, разделяющее кредитоспособных и некредитоспособных клиентов с учетом кредитных рисков.

После того, как клиент получил кредит и имеет некоторую кредитную историю, возникает задача прогнозирования изменения платежеспособности клиента с целью определения способности клиента выполнять обязательства по текущим платежам и обеспечения возврата кредита [18]. Данный вид скоринга известен как поведенческий скоринг (behavioral-скоринг) [122-123].

Помимо данных о самом клиенте, в качестве набора признаков может быть также использована следующая информация:

• информация о кредите (год взятия кредита, сумма кредита, процентная ставка, информация о доходах и расходах клиента);

• информация о кредитной истории (наличие задолженности по кредиту, наихудшее состояние счета в прошлом);

• внешние факторы (связанные с обстановкой в экономической среде, с конъюнктурой);

• внутренние факторы (вызванные ошибками самого банка).

Для решения задачи необходимо описать динамику состояния кредитного счета клиента на основе данных, которая доступна и может влиять на платежеспособность клиента. Иначе, требуется найти функциональную зависимость между прошлыми состояниями кредитного

счета и будущими, учитывая набор признаков, влияющих на кредитную историю отдельного заемщика так, чтобы доля верных прогнозов, усредненная по всем имеющимся состояниям, стремилась к максимальному значению.

В качестве состояний кредитного счета, как правило, используется информация о просроченной задолженности. ЦБ РФ выделяет следующие состояния:

- без задолженности;

- задолженность по кредиту 1 - 30 дней;

- задолженность по кредиту 31 - 90 дней;

- задолженность по кредиту 91 - 180 дней;

- задолженность по кредиту более 180 дней.

Стоит отметить отдельно требования к кредитной истории. Как правило, она берется за определенный период, составляющий 1-2 года, поскольку при меньшем сроке есть возможность недооценить вероятность дефолта, а за больший период могут произойти серьезные социально-экономические изменения, в результате которых характеристики новых клиентов будут резко выделяться на фоне старых.

Еще одним важным моментом при разработке моделей прогнозирования является вопрос об обновлении полученных моделей, которые должны иметь возможность адаптироваться к новым данным клиентов и учитывать происходящие изменения в экономической среде с целью получения более точных прогнозов и формирования обоснованного решения о выдаче кредита.

1.2. Предварительная обработка данных по клиентам

Дискретность и непрерывность данных Поскольку в реальных статистических данных приходится сталкиваться с рядом проблем [22], прежде чем приступить к построению моделей, необходимо проанализировать исходные данные по клиентам.

Как правило, различают дискретные и непрерывные признаки. К дискретным признакам относятся данные по клиенту с конечным множеством значений, например, пол клиента, образование, семейное положение и т.д. Непрерывные признаки, напротив, характеризуются множеством значений, например, возраст, стаж работы, ежемесячные доходы и расходы и т.д.

В том случае, если модель требует непрерывных данных, необходимо заменить дискретные переменные большим числом переменных, которые будут принимать значение 0 либо 1. То есть вместо набора дискретных признаков кредитоспособности клиентов {хи}, и = 1,...,п, каждый из которых принимает от 1 до уи значений, можно получить новый набор непрерывных признаков:

Для таких методов, как деревья решений и байесовский классификатор, имеет смысл использовать дискретные переменные. В этом случае область значений каждой непрерывной переменной разбивается на отрезки, номера которых представляют значения новой дискретной переменной: такой процесс называется дискретизацией или биннингом

Признаки могут иметь как числовую, так и нечисловую природу. Для удобства анализа и построения методов классификации нечисловые признаки, представленные в основном различными категориями, как правило, кодируются определенным образом: каждому номинальному значению категории ставится в соответствие дискретное значение.

Далеко не все признаки из исходного набора данных влияют на результат прогнозирования возврата кредитов [25]. Более того, наличие большого числа неинформативных признаков уменьшают статистическую

(1.1)

[73].

Кодирование нечисловых данных

Отбор информативных признаков

надежность и качество прогнозирования методов классификации, а также увеличивают время работы алгоритмов. В связи с этим актуальна проблема выбора информативных (значимых) признаков до начала работы основных методов.

Для отбора информативных признаков до начала работы основных методов классификации можно выделить следующие методы [29, 106]: полный перебор подмножеств признаков, метод главных компонент, метод пошаговой регрессии и др.

Перебирая всевозможные подмножества признаков, гарантированно можно найти лучшее подмножество. Однако при увеличении количества признаков увеличивается также сложность и время работы данного алгоритма.

При использовании метода главных компонент трудность заключается в выборе критерия отбора информативных признаков.

Суть метода пошаговой регрессии заключается в последовательном включении признаков в модель на основе критерия Фишера (^-критерия).

Формирование обучающей и тестовой выборки

Оценки качества классификации получают на данных, не участвующих в процессе построения методов классификации. Используют разделение исходного набора данных на обучающую выборку и тестовую (контрольную) выборку [90]. Обучающая выборка предназначена для построения методов классификации, а тестовая - для оценки качества методов путем сравнения реальных и прогнозируемых данных.

Также требует рассмотрения вопрос об определении необходимого объема выборки [73]. К основным критериям относят равномерное распределение зависимой переменной и число независимых переменных. Как правило, при относительно равномерном распределении значений отклика на один предиктор необходимо не менее 10 наблюдений, и чем больше распределение значений зависимой переменной смещено в пользу

какого-либо класса, тем больше наблюдений необходимо брать на один предиктор.

Среди основных способов формирования обучающей и тестовой выборки следует выделить метод удерживания, метод ^-кратной перекрестной проверки, скользящий экзамен, метод стратификации и самонастройки [17, 52]. При этом в случае малого количества данных наиболее эффективным является метод скользящего экзамена, а при больших объемах данных - метод ^-кратной перекрестной проверки совместно с процедурой стратификации.

Существуют также и другие способы формирования обучающей и тестовой выборки [45]. Например, для оценки точности моделей прогнозирования изменения платежеспособности заемщиков на шаге ^+1), исходная выборка разбивается на обучающую выборку, представляющую собой данные по клиентам за период t, и на тестовую выборку, содержащую данные по клиентам в момент времени ( +1).

Восстановление пропущенных данных кредитной истории На практике часто исходные данные содержат пропущенные значения, которые могут быть как случайными, так и неслучайными. В первом случае, информация может быть просто не введена в базу данных, либо данные получены из разных источников, например, собраны из различных кредитных бюро, а также в результате появления новых вопросов в анкете. Неполная априорная информация, во-первых, усложняет процесс построения и применения моделей классификации, а во-вторых, может повлиять на ухудшение качества оценки параметров. Если отсутствующих данных относительно немного, то можно просто удалить данные случаи. Напротив, при больших объемах отсутствующих значений, чтобы не потерять важную информацию, прибегают к методам восстановления [2-3, 33, 55, 75].

Наиболее распространенными методами по восстановлению пропущенных данных являются такие, как заполнение пропусков

средними значениями, метод ближайших соседей, регрессионный метод, метод максимального правдоподобия и ЕМ-алгоритм, алгоритм ZET, алгоритм ZetBraid, метод Бартлетта, Resampling, эволюционный метод и другие. Перечисленные методы работают с данными объектов, значения которых представлены в числовой форме [2-3].

Для данных, представленных в нечисловой форме применимы методы, основанные на замене пропущенных значений на моду либо моделирование пропущенных данных с использованием дискретного или условного распределения по присутствующим параметрам, что согласно результатам работы [4] имеет более высокую точность восстановления пропущенных значений.

1.3. Модели и методы прогнозирования возврата кредитов при

решении вопроса о выдаче кредита

Для прогнозирования возврата кредитов при решении вопроса о выдаче кредита обычно используют методы машинного обучения [60], к которым относятся использование логистической модели, дискриминантного анализа, байесовского классификатора, нейронных сетей, деревьев решений, ансамбли моделей и др.

Рассмотрим перечисленные классы моделей, а также модели, основанные на экспертном принятии решения (рейтинговые и балльные модели) и проанализируем преимущества и недостатки каждого из них.

1.3.1. Регрессионные модели

Регрессионные модели предназначены для определения связи между множеством независимых факторов (регрессоров, признаков) и зависимой переменной [14]. В рамках кредитования данный класс моделей может быть использован для предсказания вероятности появления некоторого события, например, дефолта или возврата кредита клиентом, по значениям множества факторов, описывающих клиента.

Для того чтобы определить возврат кредита клиентом вводится зависимая переменная Y, которая может принимать несколько значений: например, для двух классов в случае кредитоспособного клиента значение Y = 1, а в случае некредитоспособного - Y = 0. В качестве множества независимых факторов используются переменные X = х1,...,хп, которые представляют собой информацию о самом клиенте, находящуюся в анкете при подаче заявки на кредит.

Множественная линейная регрессия, как правило, применяется для нахождения вероятности возврата кредита Р клиентом на основе значений данных факторов:

Р = 40 + ЧХ + ••• + Чпхп, (1.2)

где Ч0,...,Чп- параметры регрессии, которые можно найти методом наименьших квадратов [53].

Важно заметить, что левая часть имеет ограничение и должна изменяться от 0 до 1, тогда как правая часть может принимать любые значения, что является одним из недостатков данной модели. Также множественная линейная регрессия обычно строится на равной доле кредитоспособных и некредитоспособных клиентов, поэтому прежде необходимо подготовить исходную выборку.

В диссертационной работе С.А. Киблицкого [36] была определена кредитоспособность физического лица с помощью методики, разработанной с использованием эволюционно-симулятивных моделей на основе линейной регрессии. При этом находилась граница разделения кредитоспособных заемщиков от некредитоспособных. Однако нет доказательств того, что данный метод превосходит по результатам остальные методы и модели. Кроме того, известно, что линейные регрессии требуют слабой коррелированности входных данных, а также представление исходных данных в виде чисел, а не в шкале наименований.

Логистическая регрессия преодолевает данный недостаток [68, 73], поскольку делается предположение о том, что вероятность кредитоспособного клиента Y = 1 равна:

Р^ = 11 X} = Дг), 7 = д0 + дх +... + qnxn, (1.3)

где /(г) - логистическая функция:

/ (г) = . (14)

1 + е v '

Поскольку переменная Y принимает одно из пары значений, то вероятность некредитоспособного клиента Y = 0 равна:

P{Y = 0 | X} = 1 - /(г). (1.5)

Таким образом, логистическая регрессия находится на основе

следующего выражения:

, Р{У = 1| X} /(г) , 1 „

1о§ --!—- ^ = q0 + дх X, +... + дпхп. ( 1.6)

Р{У = 0| X} 1 - /(г) 0 1 1 п п у J

Для нахождения параметров д0,...,дп, как правило, применим метод максимального правдоподобия [115], который сводится к максимизации функции правдоподобия с помощью метода градиентного спуска [5], метода Ньютона-Рафсона [16] или других методов.

Задача классификации потенциального заемщика решается по следующему принципу: клиент считается кредитоспособным Y =1, если модель спрогнозировала вероятность Р{У = 11 X} > 0,5, и некредитоспособным Y = 0 - в противном случае. При этом в качестве граничного значения может быть использовано число, отличное от 0,5.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Список литературы диссертационного исследования кандидат наук Шунина Юлия Сергеевна, 2016 год

СПИСОК ЛИТЕРАТУРЫ

1. Авдошин, С. М. Информационные технологии для управления финансовыми рисками / С. М. Авдошин, Е. Ю. Песоцкая // Моделирование и анализ бизнес-процессов. - 2011. - № 1 (15). - С. 42-49.

2. Айвазян, С. А. Прикладная статистика: Классификация и снижение размерности: справочное изд. / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков. - М. : Финансы и статистика, 1989. - 607 с.

3. Айвазян, С. А. Прикладная статистика: Основы моделирования и первичная обработка данных / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин. - М. : Финансы и статистика, 1983. - 472 с.

4. Алексеева, В. А. Восстановление пропущенных наблюдений при классификации объектов / В. А. Алексеева, Ю. С. Донцова (Ю. С. Шунина), В. Н. Клячкин // Известия Самарского научного центра Российской академии наук. - 2014. - Т. 16. - № 6 (2). - С. 357-359.

5. Алексеева, Е. В. Численные методы оптимизации: учеб. пособие / Е.

B. Алексеева, О. А. Кутненко, А. В. Плясунов. - Новосиб. ун-т. Новосибирск, 2008. - 128 с.

6. Андреева, Г. В. Скоринг как метод оценки кредитного риска / Г. В. Андреева // Банковские технологии. - 2000. - № 6. - С. 14-19.

7. Банных, А. А. Методика оценки кредитного риска заемщика с применением скоринга бюро кредитных историй / А.А. Банных, А.В. Лётчиков // Вестник Удмуртского университета. Серия Экономика и право. - 2013. Вып. 4. - С. 5-9.

8. Бидюк, П. И. Построение и методы обучения байесовских сетей / П. И. Бидюк, А. Н. Терентьев // Информатика и кибернетика. - 2004. - № 2. -

C. 140-154.

9. Бедняк, О. И. Категориальный анализ для принятия управленческих решений в области кредитования физических лиц: дис. ... канд. техн. наук: 05.13.10 / Бедняк Оксана Игоревна. - Самара, 2011. - 140 с.

10. Боровиков, В. П. Популярное введение в современный анализ данных в системе STATISTICA / В. П. Боровиков. - М. : Горячая линия -Телеком, 2013. - 288 с.

11. Бубырь, Д. С. Задача прогнозирования временного ряда с множеством дискретных состояний / Д. С. Бубырь, Ю. С. Донцова (Ю. С. Шунина) // Современные проблемы создания и эксплуатации радиотехнических систем: сборник научных трудов восьмой Всероссийской научно-практической конференции (с участием стран СНГ), 2013. - С. 199-201.

12. Вагин, В. Н. Достоверный и правдоподобный вывод в интеллектуальных системах / В. Н. Вагин, Е. Ю. Головина, А. А. Загорянская, М. В. Фомина; под ред. В. Н. Вагина, Д. А. Поспелова. - М. : ФИЗМАТЛИТ, 2004. - 704 с.

13. Вапник, В. Н. Восстановление зависимостей по эмпирическим данным / В. Н. Вапник. - М. : Наука, 1979. - 448 с.

14. Валеев, С. Г. Регрессионное моделирование при обработке наблюдений / С. Г. Валеев. - М. : Наука, 1991. - 272 с. (второе издание, дополненное и переработанное: Валеев, С. Г. Регрессионное моделирование при обработке данных / С. Г. Валеев. - Казань : ФЭН, 2001. - 296 с.)

15. Васильев, К. К. Статистический анализ изображений / К. К. Васильев, В. Р. Крашенинников. - Ульяновск : УлГТУ, 2014. - 214 с.

16. Васильев, Н. П. Опыт расчета параметров логистической регрессии методом Ньютона-Рафсона для оценки зимостойкости растений / Н. П. Васильев, А. А. Егоров // Математическая биология и биоинформатика. -2011. - Т. 6. - № 2. - С.190-199.

17. Вежневец, В. Оценка качества работы классификаторов / В. Вежневец // Компьютерная графика и мультимедиа. - 2006. - № 4. - Режим доступа: http://cgm. computergraphics.ru/content/view/106.

18. Гараган, С. А. Взаимодействие банков с коллекторскими организациями и кредитными брокерами [Электронный ресурс] / С.А. Гараган, O. A. Павлов. // Банковское кредитование. - 2009. - № 1. - Режим доступа: http://bankir.ru/publikacii/s/vzaimodeistvie-bankov-s-kollektorskimi-organizaciyami-i-kreditnimi-brokerami-1612149.

19. Галасюк, В. В. Об определении понятия «платежеспособность» в свете концепции CCF / В. В. Галасюк, A. B. Вишневская-Галасюк, В. В. Галасюк // Фондовый рынок. - 2003. - № 13. - С. 26-33.

20. Глинкина, Е. В. Кредитный скоринг как инструмент эффективной оценки кредитоспособности / Е. В. Глинкина // Финансы и кредит. 2011. -№ 16 (448). - С. 43-47.

21. Готовкин, И. Комплексная скоринговая модель оценки дефолта клиента / И. Готовкин // Банковские технологии. - 2006. - № 1. - С. 27-35.

22. Гринь, Н. В. Методологические аспекты построения скоринговых моделей / Н. В. Гринь // Экономика, моделирование, прогнозирование: сб. науч. тр. Вып. 6. - Минск: НИЭИ Минэкономики РБ, 2012. - С. 174-180.

23. Гребеник, В. В. Парадигмальные вопросы совершенствования механизма внедрения банковских инноваций [Электронный ресурс] / В. В. Гребеник // Интернет-журнал «Науковедение». - 2012. - № 3 (12). - Режим доступа: http ://naukovedenie.ru/ sbornik 12Z12-76.pdf

24. Донцова Ю. С. Анализ методов бинарной классификации / Ю. С. Донцова (Ю. С. Шунина) // Известия Самарского научного центра Российской академии наук. - 2014. - Т. 16. - № 6 (2). - С. 434-438.

25. Донцова, Ю. С. Анализ инновационных механизмов в области кредитования физических лиц / Ю. С. Донцова (Ю. С. Шунина), В. Н. Клячкин // Региональная экономика: актуальные вопросы и новые тенденции: сборник научных трудов Международной заочной научно-практической конференции. В 2 т. Ульяновск: УлГТУ, 2014. - Т. 2. - С. 105-111.

26. Донцова, Ю.С. Прогнозирование состояний ипотечного кредита с помощью марковской цепи и логистической регрессии / Ю. С. Донцова (Ю. С. Шунина) // Вузовская наука в современных условиях: сборник материалов 47-й научно-технической конференции. В 3 ч. Ч. 2. -Ульяновск: УлГТУ, 2013. - С. 304-307.

27. Донцова, Ю.С. Применение марковских цепей в системе кредитного скоринга / Ю. С. Донцова (Ю. С. Шунина) // Междисциплинарные исследования в области компьютерного моделирования и информатики. Материалы 3-й научно-практической internet-конференции. - 2014. - С. 185-189.

28. Донцова, Ю. С. Построение скоринговой модели на основе марковских цепей / Ю. С. Донцова (Ю. С. Шунина) // Вузовская наука в современных условиях: сборник материалов 48-й научно-технической конференции. В 3 ч. Ч. 2. - Ульяновск: УлГТУ, 2014. - С. 258-261.

29. Дрейпер, Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. - М. : «Диалектика», 2007. - 912 c.

30. Дубров, А. М. Многомерные статистические методы: Учебник / А. М. Дубров, В. С. Мхитарян, Л. И. Трошин. - М. : Финансы и статистика, 2003. - 352 с.

31. Ефимов, А. М. Современные методы оценки кредитоспособности физических лиц / А. М. Ефимов // Банковский ритейл. - 2010. - № 2 - С. 81-91.

32. Журавель, Ю. Ю. Что может и чего не может скоринг в потребительском кредитовании? / Ю. Ю. Журавель // Банковский ритейл. -2006. - № 4. - С. 34-38.

33. Злоба, Е. Статистические методы восстановления пропущенных данных / Е. Злоба, И. Яцкие // Computer Modelling & New Technologies. -2002. - Vol. 6. - № 1. - P. 51-61.

34. Кабушкин, С. Н. Управление банковским риском / С. Н. Кабушкин. -Минск. - 2006. - 180 с.

35. Кадыков, Г. Г. Антикризисное управление: учебное пособие для технических вузов / Г. Г. Кадыков, Р. С. Сайфуллин; под ред. Е. С. Минаева и В. П. Панагушина. - М. : Приор, 2003. - 421 с.

36. Киблицкий, С. А. Скоринг-методика оптимизации банковской деятельности при кредитовании физических лиц: дис. ... канд. экон. наук: 08.00.13 / Киблицкий Сергей Алексеевич. - М., 2011. - 124 с.

37. Ковалев, П. П. Банковский риск - менеджмент / П. П. Ковалев. М. -2009. - 212 с.

38. Коссова, Т. В. Оценка кредитного риска компаний российского корпоративного сектора на основе прогнозирования вероятности дефолта по обязательствам / Т. В. Коссова, Е. В. Коссова // Проблемы анализа риска. - Том 8. - 2011. - № 2. - С.68-78.

39. Колоколова, О. В. Оптимизационное моделирование кредитного портфеля / О. В. Колоколова // Сборник статей «Актуальные проблемы развития современной экономики России», Рос. Экон. акад., Москва, 2004. - С. 46-50.

40. Кельберт, М. Я. Вероятность и статистика в примерах и задачах. Т. II: Марковские цепи как отправная точка теории случайных процессов и их приложения / М. Я. Кельберт, Ю. М. Сухов. - М. : МЦНМО, 2009. - 295 с.

41. Клейнер, Г. Б. История современного кредитного скоринга [Электронный ресурс] / Г. Б. Клейнер, Д. С. Коробов // Проблемы региональной экономики. - 2012. - № 17. - Режим доступа: http://regec.rU/articles/2012/vol1/5.pdf

42. Клячкин, В. Н. Модели и методы статистического контроля многопараметрического технологического процесса / В. Н. Клячкин. - М. : ФИЗМАТЛИТ, 2011. - 196 с.

43. Клячкин, В. Н. Статистические методы в управлении качеством: компьютерные технологии: учеб. пособие / В. Н. Клячкин. - М. : Финансы и статистика, ИНФРА-М, 2009. - 304 с.

44. Клячкин, В. Н. Сравнительный анализ точности нелинейных моделей при прогнозировании состояния системы на основе марковской цепи / В. Н. Клячкин, Ю. С. Донцова (Ю. С. Шунина) // Известия Самарского научного центра Российской академии наук. - 2013. - Т. 15. - № 4 (4). - С. 924-927.

45. Клячкин, В. Н. Диагностика состояния процесса по результатам контроля рассеяния / В. Н. Клячкин, Т. И. Святова, Ю. С. Донцова (Ю. С. Шунина) // XII Всероссийское совещание по проблемам управления: Труды. - М. : Институт проблем управления им. В. А. Трапезникова РАН, 2014. - С. 7605-7615.

46. Клячкин, В. Н. Разработка информационно-математической системы раннего предупреждения об аварийной ситуации по множеству характеристик состояния технического объекта / В. Н. Клячкин, В. Р. Крашенинников, Ю. Е. Кувайскова, Ю. С. Донцова (Ю. С. Шунина) и др. // Отчет по федеральной целевой программе «Научные и научно-педагогические кадры инновационной России». Ульяновск, 2013. № госрегистрации 01201277191 (на правах рукописи).

47. Клячкин, В. Н. Система оценки кредитоспособности заемщиков и прогнозирования возврата кредитов // В. Н. Клячкин, Ю. С. Шунина / Вестник компьютерных и информационных технологий. - 2015. - № 11. -С. 45-51.

48. Клячкин, В. Н. Методы прогнозирования платежеспособности заемщиков / В. Н. Клячкин, Ю. С. Шунина // Финансовая аналитика: проблемы и решения. - 2015. - № 41 (275). - С. 10-21.

49. Крашенинников, В. Р. Основы теории обработки изображений / В. Р. Крашенинников - Ульяновск : Изд. УлГТУ, 2003. - 152 с.

50. Крашенинников, В. Р. Обновление моделей прогнозирования кредитоспособности клиентов / В. Р. Крашенинников, Ю. С. Шунина, В. Н. Клячкин // Финансовая аналитика: проблемы и решения. - 2016. - № 8 (290). - С. 2-9.

51. Лаврушин, О. И. Банковское дело: современная система кредитования: учебное пособие / О. И. Лаврушин, О. Н. Афанасьева, С. Л. Корниенко. - М. : КНОРУС, 2006. - 256 с.

52. Лбов, Г. С. Анализ данных и знаний / Г. С. Лбов // Учебное пособие. Издательство НГТУ. - Новосибирск, 2001. - 90 с.

53. Линник, Ю. В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений / Ю. В. Линник. - М. : Физматгиз, 1962. - 333 с.

54. Литвинова, С. А. Скоринговые системы как средство минимизации кредитного риска банка / С. А. Литвинова // Аудит и финансовый анализ. -2010. - № 2. - С. 396-397.

55. Литтл, Р. Дж. А. Статистический анализ данных с пропусками / Р. Дж. А. Литтл, Д. Б. Рубин; пер. с англ. - М. : Финансы и статистика, 1990. - 336 с.

56. Лепский, А. Е. Математические методы распознавания образов: Курс лекций / А. Е. Лепский, А. Г. Броневич. - Таганрог: Изд-во ТТИ ЮФУ, 2009. - 155 с.

57. Лобанов, А. А. Энциклопедия финансового риск-менеджмента / Под ред. А. А. Лобанова, А. В. Чугунова - М. : Альпина Паблишер, 2003. - 786 с.

58. Лукашин, Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов / Ю. П. Лукашин. - М. : Финансы и статистика, 2003. 416 с.

59. Мадера, А. Г. Прогнозирование кредитной благонадежности заемщика / А. Г. Мадера // Финансы и кредит. - 2013. - № 12 (540). - С. 210.

60. Мерков, А. Б. Распознавание образов: введение в методы статистического обучения / А. Б. Марков. - М. : Едиториал УРСС, 2011. 254 с.

61. Мещеряков, В. А. Применение нейросетевых технологий для решения задачи дискриминантного анализа в МАТЬАВ / В. А. Мещеряков // Проектирование инженерных и научных приложений в среде МАТЬАВ: материалы V Международной научной конференции. - Харьков: «БЭТ»,

2011. - С. 360-366.

62. Мищенко, А. В. Современные подходы к оценке и прогнозированию кредитных рейтингов банков / А. В. Мищенко, А. С. Чижова // Финансовый менеджмент. - 2006. - № 2. - С. 39-50.

63. Морозова, З. А. Статистическая оценка рисков потребительского кредитования / З. А. Морозова, Л. И. Ниворожкина, Т. Г. Синявская // Вестник Ростовского государственного экономического университета. -

2012. - № 4. - 66 с.

64. Паклин, Н. Б. Бизнес-аналитика: от данных к знаниям: учеб. пособие / Н. Б. Паклин, В. И. Орешков. - 2-е изд., испр. - СПб. : Питер, 2013. - 704 с.

65. Патласов, О. Ю. Моделирование оценки возможности привлечения заемных средств субъектами предпринимательства / О. Ю. Патласов, Н. В. Васина // Аудит и финансовый анализ. - 2009. - № 5. - С. 102-109.

66. Пищулин, А. Система кредитного скоринга как конкурентное преимущество для ритейл банкинга [электронный ресурс] / А. Пищулин // Журнал «Финансовый директор». - № 8 (72). - Режим доступа: http://www.scorto.ru/article8.htm.

67. Пищулин, А. Очки для заемщика: зачем нужны скоринговые системы / А. Пищулин // Деньги. - 2008. - № 2. - С. 40-47.

68. Петров, С. В. Разработка скоринговой модели с помощью логистической регрессии (на базе пакета R) / С. В. Петров, А. В. Груздев // Риск-менеджмент в кредитной организации. - 2012. - № 3 (07). - С. 26-41.

69. Полежаев, И. Е. Марковская модель для прогнозирования состояния клиентской базы данных / И. Е. Полежаев // Электронный научный журнал «ИССЛЕДОВАНО В РОССИИ». - 2006. - С. 1903-1917.

70. Поляк, Б. Т. Псевдоградиентные алгоритмы адаптации и обучения / Б. Т. Поляк, Я. З. Цыпкин // Автоматика и телемеханика. - 1973. - № 3. -С. 45-68.

71. Поляк, Б.Т. Оптимальные псевдоградиентные алгоритмы адаптации / Б. Т. Поляк, Я. З. Цыпкин // Автоматика и телемеханика. - 1980. - № 8. -С. 74-84.

72. Соколов, Г. А. Теория вероятностей. Управляемые цепи Маркова в экономике / Г. А. Соколов, Н. А. Чистякова. - М. : ФИЗМАТ ЛИТ, 2005. -248 с.

73. Сорокин, А. С. Построение скоринговых карт с использованием модели логистической регрессии [Электронный ресурс] / А. С. Сорокин // Интернет-журнал «НАУКОВЕДЕНИЕ». - Выпуск 2. - 2014. - март-апрель. - Режим доступа: http://naukovedenie.ru/PDF/180EVN214.pdf

74. Сорокин, А. С. К вопросу валидации модели логистической регрессии в кредитном скоринге [Электронный ресурс] / А. С. Сорокин // Интернет-журнал «НАУКОВЕДЕНИЕ». - Выпуск 2. - 2014. - март-апрель. Режим доступа: http://naukovedenie.ru/PDF/ 173EVN214 .pdf

75. Снитюк, В. Е. Эволюционный метод восстановления пропусков в данных / В. Е. Снитюк // Сборник трудов междунар. конф. «Интеллектуальный анализ информации». - К. - 2006. С. 262-271.

76. Тимофеева, Г. А. Прогнозирование составляющих кредитного портфеля на основе модели марковской цепи / Г. А. Тимофеева, Н. А. Тимофеев // Автоматика и телемеханика. - 2012. - № 4. - С. 47-65.

77. Тихонов, Э. Е. Прогнозирование в условиях рынка / Э. Е. Тихонов // Невинномысск, 2006. - 221 с.

78. Тихонов, В. И. Марковские процессы / В. И. Тихонов, М. А. Миронов. - М. : «Сов. радио», 1977. - 488 с.

79. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика / Ф. Уоссермен // Перевод на русский язык, Ю.А. Зуев, В.А. Точенов, 1992. -118 с.

80. Уланов, С. В. Оценка качества и сравнение скоринговых карт / С. В. Уланов // Экономические науки. - 2009. - № 9 (58). - С. 331-335.

81. Ульянов, Д. П. Разработка имитационных моделей и программных средств для анализа кредитных и валютных рисков многофилиального банка: дис. ... канд. экон. наук: 08.00.13 / Ульянов Денис Петрович. -Волгоград, 2008. - 148 с.

82. Фатьянова, А.А. Использование скоринговых моделей для стратегического управления субпортфелем потребительских кредитов / А.А. Фатьянова // Вестник СГСЭУ. - 2009. - № 2(26). - 109 с.

83. Фантаццини, Д. Эконометрический анализ финансовых данных в задачах управления риском. Часть 4: Управление кредитным риском (продолжение) / Д. Фантаццини // Прикладная эконометрика. - 2009. - № 1 (13). - С. 105-138.

84. Федотова, М. А. Сравнительный анализ методик оценки кредитоспособности заемщика / М. А. Федотова // Вестник Самарского государственного экономического университета. - 2010. - № 1 (63). - С. 101-106.

85. Фот, Н. П. Статистические методы оценки кредитоспособности / Н. П. Фот // ВЕСТНИК ОГУ. - 2008. - № 6 (88). - С. 87-92.

86. Хабибуллина, А. В. Модели анализа кредитоспособности заёмщика / А. В. Хабибуллина // Вестник НБУ. - 2012. - № 1. - С. 43-47.

87. Чижова, А. С. Эконометрическая модель оценки матриц вероятностей перехода кредитных рейтингов / А. С. Чижова // Прикладная эконометрика. - 2007. - № 3 (7). - С. 11-26.

88. Черников, К. С. Снижение уровня банковского риска посредством прецедентного моделирования кредитной ситуации: дис. ... канд. техн. наук: 05.13.18 / Черников Константин Сергеевич. - Ульяновск, 2012. - 151 с.

89. Шунина, Ю. С. Прогнозирование кредитоспособности клиентов банка на основе методов машинного обучения / Ю. С. Шунина, В. А.

90. Шунина, Ю. С. Влияние способа формирования обучающей и тестовой выборок на качество классификации / Ю. С. Шунина // Вестник Ульяновского государственного технического университета. - 2015. - № 2 (70). - С. 43-46.

91. Шунина, Ю. С. Критерии качества работы классификаторов / Ю. С. Шунина, В. А. Алексеева, В. Н. Клячкин // Вестник Ульяновского государственного технического университета. - 2015. - № 2 (70). - С. 6770.

92. Шунина, Ю. С. Исследование динамики состояний системы на стационарность и наличие марковского свойства / Ю. С. Шунина // Современные проблемы проектирования, производства и эксплуатации радиотехнических систем: сборник научных трудов девятой Всероссийской научно-практической конференции (с участием стран СНГ). - 2015. - С. 42-44.

93. Шунина, Ю. С. Система кредитного скоринга на основе агрегированных классификаторов и марковских цепей / Ю. С. Шунина // Актуальные направления научных исследований XXI века: теория и практика. - Воронеж : ФГБОУ ВО «ВГЛТУ», 2015. - № 8 (19-1). - С. 432435.

94. Шунина, Ю. С. Отбор информативных признаков кредитоспособности клиентов с помощью метода пошаговой регрессии / Ю. С. Шунина, В. Н. Клячкин // Информатика и вычислительная техника: сборник научных трудов 7-й Всероссийской научно-технической конференции аспирантов, студентов и молодых ученых / под ред. В. Н. Негоды. - Ульяновск : УлГТУ, 2015. - С. 582-585.

95. Шунина, Ю. С. Дискретизация данных о клиентах при прогнозировании их кредитоспособности / Ю. С. Шунина, В. Н. Клячкин // Информатика, моделирование, автоматизация проектирования: сборник

научных трудов VII Всероссийской школы-семинара аспирантов, студентов и молодых ученых (ИМАП-2015, г. Ульяновск, 27-28 октября 2015 г.) / под ред. А. Н. Афанасьева. - Ульяновск: УлГТУ, 2015. - С. 235238.

96. Якупов, А. И. Применение деревьев решений для моделирования кредитоспособности клиентов коммерческого банка / А. И. Якупов // Искусственный интеллект. - 2008. - № 4. - С. 208-213.

97. Armstrong, J. S. Forecasting for Marketing / J. S. Armstrong // Quantitative Methods in Marketing. London: International Thompson Business Press, 1999. - P. 92-119.

98. Anderson, T. W. Statistical inference about Markov chains / T. W. Anderson, L. A. Goodman // The Annals of Mathematical Statistics. - 1957. -№ 28. - P. 89-110.

99. Altman, E. I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy / E. I. Altman // The Journal of Finance. - 1968. -№ 23 (4) - P. 589-609.

100. Baesens, B. Learning Bayesian network classifiers for credit scoring using Markov chain Monte Carlo search / B. Baesens, M. Egmont-Petersen, R. Castelo, J. Vanthienen // Proc. International Congress on Pattern Recognition, 2002. - Vol. 3. - P. 49-52.

101. Breiman, L. Bagging predictors / L. Breiman // Machine Learning. -1996. - V. 26. - No. 2. - P. 123-140.

102. Breiman, L. "Random Forests" / L. Breiman // Machine Learning. -2001. - № 45 (1). - P. 5-32.

103. Bronnenberg, B. J. Advertising Frequency Decisions in a Discrete Markov Process Under a Budget Constraint / B. J. Bronnenberg // Journal of Marketing Research, 1998. - № 35 (3). - P. 399-406.

104. Chesser, D. L. Predicting Loan Noncompliance Текст. / D. L. Chesser // The Journal of Commercial Bank Lending. - 1974. - № 56 (12). - P. 28-38.

105. Diggle, P. J. Analysis of Longitudinal Data / P. J. Diggle, P. Heagerty, K. Y. Liang, S. L. Zeger. - Oxford University Press: Oxford, 2002. - 379 p.

106. Dingyu, Xue Solving applied mathematical Problems with MATLAB / Dingyu Xue, Yangquan Chen // Taylor & Francis Group, LLC, 2009. - 418 p.

107. Fawcett, T. An Introduction to ROC Analysis / T. Fawcett // Pattern Recognition Letters. - 2006. - № 27 (8). - P. 861-874.

108. Ghodselahi, A. Application of Artificial Intelligence Techniques for Credit Risk Evaluation / A. Ghodselahi, A. Amirmadhi // International Journal of Modeling and Optimization. August 2011. - Vol. 1. - No. 3. - P. 243-249.

109. Grimshaw, S. Markov chain models for delinquency: Transition matrix estimation and forecasting / S. Grimshaw, W. Alexander // Applied Stochastic Models in Business and Industry. - 2011. - № 27 (3). - P. 267-279.

110. Levine, G. Gustav Levine's Guide to SPSS for Analysis of Variance / Gustav Levine, Sanford L. Braver, David P. Mackinnon, Melanie C. Page. -Lawrence Erlbaum Associates; 2nd edition. - 2005. - 200 p.

111. Hamadani, A. Z. An Integrated Genetic-Based Model of Naive Bayes Networks for Credit Scoring / A. Z. Hamadani, A. Z. Shalbafzadeh, T. Rezvan, A. S. Moghadam // International Journal of Artificial Intelligence & Applications (IJAIA). January 2013. - Vol. 4. - No. 1. - P. 85-103.

112. Hand, D. J. A simple generalization of the area under the ROC curve for multiple class classification problems / D. J. Hand, R. J. Till // Machine Learning. - 2011. - № 45. - P. 171-186.

113. Hand, D. J. Statistical Classification Methods in Consumer Credit Scoring: A Review / D. J. Hand, W. Henley // Journal of the Royal Statistical Society, 1997. - Vol. 160. - No. 3. P. 523-541.

114. Hyafil, L. Constructing Optimal Binary Decision Trees is NP-complete / L. Hyafil, R. L. Rivest // Information Processing Letters. - 1976. - 5 (1). - P. 15-17.

115. McSharry, P. E. Better Nonlinear Models from Noisy Data: Attractors with Maximum Likelihood / P. E. McSharry, L. A. Smith // Phys. Rev. Lett. -1999. - V. 83. - P. 4285-4288.

116. Neapolitan, R. E. Learning Bayesian Networks / R. E. Neapolitan. - NJ: Prentice Hall, 2003. - 704 p.

117. Ogwang, T. A Convenient Method of Computing the Gini Index and its Standard Error / T. Ogwang // Oxford Bulletin of Economics and Statistics. -2011. - № 62. - P. 123-129.

118. Powers, David M. W. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation / David M. W. Powers // Journal of Machine Learning Technologies. - 2011. - № 2 (1). - P. 37-63.

119. Pfeifer, P. E. Modeling customer relationships as Markov Chains / P. E. Pfeifer, L. Robert // Journal of Interactive Marketing, 2000. - № 14 (2). - P. 4355.

120. Quinlan, J. R. C4.5 Programs for Machine Learning / J. R. Quinlan // Morgan Kaufmann. San Mateo, California. - 1993. - 302 p.

121. Thomas, L. C. Credit Scoring and its Applications: SIAM Monographs on Mathematical Modeling and Computation / L. C. Thomas, D. B. Edelman, J. N. Crook. - SIAM: Philadelphia, USA. - 2002. - 248 p.

122. Thomas, L. C. Time will tell: behavioral scoring and the dynamics of consumer credit assessment // L. C. Thomas, J. Ho, W. T. Scherer // IMA Journal of Management Mathematics. - 2001. - V. 12. - P. 89-103.

123. Thomas, L. C. A survey of credit and behavioral scoring: forecasting financial risk of lending to consumers / L. C. Thomas // International Journal of Forecasting. - 2000. - V. 16. - P. 149-172.

124. Thomas, L. C. Readings in Credit Scoring / L. C. Thomas, D. E. Edelman, J. N. Crook. - Oxford University Press, - 2004. - 338 p.

125. Wall, A. Study of Credit Barometrics / A. Wall // Federal Reserve Bulletin. - 1919. - № 3. - P. 229-243.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.