【发布时间】:2019-01-03 13:31:53
【问题描述】:
我对@987654322@ 和直python 有点熟悉,但对scikit-learn 或numpy 不太熟悉。
我在http://scikit-learn.org/stable/modules/tree.html#treescikit-learn 中找到了鸢尾花数据集的以下代码
from sklearn.datasets import load_iris
from sklearn import tree
iris = load_iris()
clf = tree.DecisionTreeClassifier()
clf = clf.fit(iris.data, iris.target)
我不想使用 scikit-learn 中的 iris,而是加载格式为以下格式的 csv 文件:
A,B,C,D
5.1,3.5,1.4,0.2
4.9,3.0,1.4,0.2
4.7,3.2,1.3,0.2
4.6,3.1,1.5,0.2
.........
如何加载它,将其放入clf.fit(?,?),我需要使用什么来代替iris.target?
【问题讨论】:
-
您可以使用
data = np.genfromtext('filename.csv', delimiter=',', skip_header=1)加载它。你可以把它传递给clf.fit,比如:clf.fit(data, ___),你应该用target填写空白,但我不确定那会是什么。
标签: python numpy scikit-learn