【发布时间】:2013-11-21 07:44:50
【问题描述】:
我正在使用 python 做一些机器学习。
我有一个包含 2000 个条目的 python nd 数组。每个条目都有一些主题的信息,最后有一个布尔值来告诉我他们是否是吸血鬼。
数组中的每个条目如下所示:
[height(cm), weight(kg), stake aversion, garlic aversion, reflectance, shiny, IS_VAMPIRE?]
我的目标是能够根据上面显示的对象数据给出一个新对象是吸血鬼的概率。
我已经使用 sklearn 为我做了一些机器学习:
clf = tree.DecisionTreeRegressor()
clf=clf.fit(X,Y)
print clf.predict(W)
其中 W 是新主题的数据数组。我编写的脚本返回布尔值,但我希望它返回概率。如何修改?
【问题讨论】:
-
你的吸血鬼数据集是公开的吗,有兴趣的可以看看吗?
-
我有一个 CSV 文件。