LGD-модели для розничного кредитования. Часть 2: разработка «ядра» модели
Размещено на сайте 24.12.2021
В предыдущей статье мы разобрали первые три фазы проекта разработки модели LGD согласно стандарту CRISP-DM: понимание целей задачи, изучение данных и подготовка данных. Разработка модели является следующей фазой, которую в рамках методологии ПВР и МСФО (IFRS) 9 можно разделить на три этапа: разработка «ядра» модели, калибровка модели, применение надбавок. Рассмотрим первый этап.
Сергей АФАНАСЬЕВ, КБ «Ренессанс Кредит», вице-президент, начальник управления статистического анализа
Анастасия СМИРНОВА, КБ «Ренессанс Кредит», начальник отдела разработки и анализа эффективности скоринговых систем
Ильгиз АХМЕТСАФИН, КБ «Ренессанс Кредит», руководитель направления разработки рейтинговых систем
Игорь МОЛОКАНОВ, КБ «Ренессанс Кредит», главный аналитик направления разработки рейтинговых систем
Приводятся извлечения из статьи.
Полную версию материала читайте в журнале.
Подписаться
Этапы разработки «ядра» модели: (1) разработка расширенного списка признаков, (2) отбор переменных, (3) препроцессинг данных, (4) выбор алгоритма моделирования, (5) настройка гиперпараметров и обучение модели, (6) обучение «ядра» модели.
|
Если LGD имеет мультимодальный характер распределения, для построения «ядра» модели рекомендуется использовать подход Cure/Loss Rate — строить комбинированную модель с использованием бинарного классификатора и алгоритма регрессии.
|
Для получения хороших, устойчивых результатов линейной регрессии важно корректно оценивать регрессионные коэффициенты, которые должны быть несмещенными.
|
Дерево решений способно распознать зависимость целевой переменной и признаков даже в случае мультимодального распределения целевой переменной (в отличие от линейной регрессии, где мультимодальность может стать проблемой).
|
После обучения «ядра» модели рекомендуется проверить статистическую значимость отобранных признаков, а также провести экспертный анализ признаков. По результатам анализа рекомендуется удалить неинформативные признаки и перестроить «ядро» модели на финальном наборе признаков.
|