【发布时间】:2020-07-05 04:08:53
【问题描述】:
我正在学习基本的机器学习模型,但遇到了下一个问题:预测线与数据集不太吻合。我正在生成一个简单的 2 类数据集并训练 SVM 和逻辑回归。虽然指标显示出良好的结果,但可视化效果很差:训练线显然没有将两个类分开。我不太明白怎么回事,有人可以解释一下吗?
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
X, y = datasets.make_blobs(n_samples=100, centers=2, n_features=2, center_box=(0, 12))
clf = LogisticRegression()
clf.fit(X_train, y_train)
plt.plot(X_train[:, 0], X_train[:, 0] * svc.coef_[:, 1] + svc.coef_[:, 0])
plt.plot(X_train[:, 0][y_train == 0], X_train[:, 1][y_train == 0], 'g^')
plt.plot(X_train[:, 0][y_train == 1], X_train[:, 1][y_train == 1], 'bs')
【问题讨论】:
-
不清楚你的问题到底是什么。请更详细地解释它。例如,到目前为止你已经尝试过什么,你观察到了什么等等。
-
另外,请让您的代码可重现 -
X_train和y_train来自哪里,以及“指标显示良好结果”究竟如何?
标签: machine-learning scikit-learn logistic-regression