【发布时间】:2015-09-22 03:16:54
【问题描述】:
如果这是计算分类器交叉验证精度的正确方法,请告诉我?我将数据集分为用于训练数据的 xtrain 和 ytrain 以及用于测试集的 xtest 和 ytest。
构建模型:
RFC = RandomForestClassifier(n_estimators=100)
将其拟合到训练集:
RFC.fit(xtrain, ytrain)
这是我不确定的部分:
scores = cross_val_score(RFC, xtest, ytest, cv = 10, scoring='precision')
使用上面的代码,“分数”会给我在训练数据上训练的模型的精度吗?我很害怕我曾经写错了代码并且我正在将模型拟合到 xtest,因为我的测试数据的召回率和精度分数高于我无法弄清楚为什么的训练数据的分数!
【问题讨论】:
标签: random-forest prediction cross-validation