【发布时间】:2014-07-19 08:05:33
【问题描述】:
在使用自举样本构建随机森林中的每棵树时,对于每个终端节点,我们从 p 个变量中随机选择 m 个变量以找到最佳分割(p 是数据中的特征总数)。我的问题(针对 RandomForestRegressor)是:
1) max_features 对应什么(m 或 p 或其他)?
2) 是从max_features变量中随机选择m个变量(m的值是多少)?
3) 如果 max_features 对应于 m,那么我为什么要将它设置为等于 p 以进行回归(默认)?这个设置的随机性在哪里(即,它与 bagging 有什么不同)?
谢谢。
【问题讨论】:
标签: scikit-learn