Практический подход к обучению логрегрессии на низкодефолтных портфелях с использованием балансировки данных
Размещено на сайте 24.06.2024
При значительном превосходстве количества недефолтных наблюдений в обучающей выборке логистическая регрессия может сосредоточиться на недефолтном классе, не выявляя характеристики дефолтного. Одним из подходов к решению проблемы может быть увеличение дефолтного класса путем генерации соответствующих синтетических примеров. Для этого могут применяться алгоритмы балансировки данных SMOTE и ADASYN, возможности которых демонстрируются в статье.
Дмитрий КУРЕННОЙ, ПАО «Промсвязьбанк», управляющий риск-менеджер отдела моделирования, ВМК МГУ им. М.В. Ломоносова
Иван НАУМОВ, ВМК МГУ им. М.В. Ломоносова