Как улучшить качество прогнозных моделей с помощью переменных — правил случайного леса?
Размещено на сайте 30.07.2018
В статье пойдет речь о том, как можно улучшить модель логистической регрессии с помощью признаков, полученных на основе правил случайного леса с использованием пакета R inTrees. Как построить ансамбль деревьев, извлечь правила из ансамбля и измерить качество правил? Какими способами можно извлечь компактный набор релевантных и неизбыточных правил? Что представляет собой метод направленного регуляризованного случайного леса? Как конструировать переменные на основе правил случайного леса и использовать их для улучшения модели логистической регрессии?
Артем ГРУЗДЕВ, ИЦ «Гевисста», директор
Приводятся извлечения из статьи.
Полную версию материала читайте в журнале.
Подписаться
Поскольку результирующее значение в ансамб- ле деревьев часто присваивается наблюдению на основе части обучающих данных, процесс присвоения может быть ненадежным. Таким образом, можно извлечь из ансамбля деревьев условия, а затем уже присваивать результирующие значения условиям, основываясь на всех обучающих данных.
|
Направленный регуляризованный случайный лес может не только отбирать переменные, но и оценивать каждую переменную.
|