【发布时间】:2017-01-15 06:04:32
【问题描述】:
我正在尝试 Kaggle 房价挑战:https://www.kaggle.com/c/house-prices-advanced-regression-techniques
这是我写的脚本
train <- read.csv("train.csv")
train$Id <- NULL
previous_na_action = options('na.action')
options(na.action = 'na.pass')
sparse_matrix <- sparse.model.matrix(SalePrice~.-1,data = train)
options(na.action = previous_na_action)
model <- xgboost(data = sparse_matrix, label = train$SalePrice, missing = NA, max.depth = 6, eta = 0.3, nthread = 4, nrounds = 16, verbose = 2, objective = "reg:linear")
importance <- xgb.importance(feature_names = sparse_matrix@Dimnames[[2]], model = model)
print(xgb.plot.importance(importance_matrix = importance))
数据有 70 多个特征,我使用 xgboost 和 max.depth = 6 和 nrounds = 16。
我得到的重要性图非常混乱,我如何才能只查看前 5 个功能或其他东西。
【问题讨论】: