Издания и мероприятия для банковских специалистов:
 
Методический журнал
Риск-менеджмент в кредитной организации
Описание изданияСвежий номер Архив Приобрести/Подписаться
Выходит один раз в квартал
Объем 112 с
Издается с 2011 года
 
 

Анализ пропущенных значений для обработки данных о заемщиках

Размещено на сайте 13.05.2014
Наблюдения с пропущенными значениями представляют серьезную проблему, потому что типичные процедуры моделирования просто «отбраковывают», исключают их из анализа. Когда есть несколько пропущенных значений (меньше 5% от общего числа наблюдений) и их можно рассматривать как пропущенные случайно, то есть факт пропуска не зависит от других значений, традиционный метод удаления пропущенных значений построчно (целиком) относительно «безопасен». Процедуры обработки пропущенных значений могут помочь нам определить, является ли построчное удаление обоснованным, и предлагают методы восстановления пропусков, когда удалять наблюдение нецелесообразно.
 
А.В. Груздев, исследовательская компания «Гевисста», директор
 
 
Приводятся извлечения из статьи. Полную версию материала читайте в журнале. Подписаться
 
 
Четыре метода анализа пропущенных значений: целиком, попарно, метод максимизации ожидания и метод регрессии.
Обычно при работе со статистическими пакетами выделяют два типа пропущенных значений: системно пропущенные и пропущенные пользователем (пользовательские).
Таблица t-критериев с раздельными дисперсиями помогает определить переменные, у которых структуры пропущенных значений могут влиять на интересующие нас количественные переменные.
 
 
 
 
Другие проекты ИД «Регламент»