【发布时间】:2016-02-08 17:22:51
【问题描述】:
我的数据非常不平衡,目标是分类。首先,我想检查多数类的欠采样。 1 类有 600、2 类 90、3 类 60 和 4 类 96 样本数据!!!
为什么使用权重,结果不是更好?
这是我的代码:cfr = RandomForestClassifier(n_estimators=100,n_jobs=5,class_weight={1:1,2:30,3:30,4:30})
我的代码有什么问题吗?你能指导我吗?
【问题讨论】:
标签: numpy import machine-learning scikit-learn random-forest