Разработка скоринговой модели с помощью метода деревьев решений
Размещено на сайте 03.06.2013
Метод деревьев решений является, пожалуй, вторым по популярности (после логистической регрессии) из наиболее часто используемых в кредитном скоринге. Деревья решений используются для классификации заемщиков на «хороших» и «плохих», определения правил кредитной политики, вычисления различных количественных показателей платежеспособности заемщика. В статье пойдет речь о построении модели дерева, диагностике качества модели и интерпретации полученных результатов.
А.В. Груздев, исследовательская компания «Гевисста», директор
Приводятся извлечения из статьи.
Полную версию материала читайте в журнале.
Подписаться
Терминальный узел — конечный узел дерева, который не расщепляется и в котором рост останавливается. Терминальный узел содержит: для деревьев регрессии — наилучший прогноз; для деревьев классификации — наилучший результат классификации.
|
Чаще всего для оценки неоднородности в узле применяется индекс Джини.
|
Техника прунинга (отсечения ветвей дерева) приводит к уменьшению числа узлов и упрощению структуры дерева, позволяет минимизировать переобучение.
|
В нашем случае главным предиктором дефолта стал процент кредитных обязательств от дохода (debtinc).
|