【发布时间】:2019-11-22 18:39:55
【问题描述】:
我认为在拟合数据并预测训练集之后,您应该获得接近 100% 的准确率。我的意思是这才有意义。该算法基于该数据集进行学习。但是当我这样做时:
classifier.fit(X_train, y_train)
pred = classifier.predict(X_test)
print(accuracy_score(y_test, pred))
>>> 0.810126582278481
这很好。但是,如果我这样做:
pred = classifier.predict(X_train)
print(accuracy_score(y_train, pred))
>>> 0.6677316293929713
这不是谬论吗?还是我做错了什么……?这适用于 RandomForestClassifier、MLPClassifier 和 SVC。
【问题讨论】:
标签: python machine-learning scikit-learn training-data