【发布时间】:2018-04-15 02:18:09
【问题描述】:
我想制作一个决策树分类器来预测我的测试集中的“目标”值(“制造”或“错过”),然后计算分类器的准确度。
标题: 位置,w,final_margin,shot_number,period,game_clock,shot_clock, 运球,touch_time,shot_dist,pts_type,close_def_dist, 目标
这是训练集的一部分:
H,W,13,3,1,399,11.1,0,3.7,0.5,2,1,错过 A,L,-12,6,2,369,6.8,0,3.2,16.3,2,5.9,制造 A,L,-4,2,2,449,24,1,1.6,4.9,2,1.5,错过 A,W,12,7,3,436,16.1,0,1.1,20.2,2,5,错过 A,W,4,16,4,253,14,5,5.5,8.1,2,3,错过 A,L,-19,12,3,359,6.6,2,3.6,7.3,2,2.8,制造
部分测试集:
H,W,12,16,3,161,11,5,4.6,6.5,2,2.3 H,W,4,3,1,343,15.3,0,0.7,3.1,2,2.7 A,L,-27,2,1,318,15.6,0,1,24.5,3,5 A,L,-6,5,2,253,16.7,7,7.9,3,2,1.1 A,W,2,4,1,365,12.8,1,2.8,4.3,2,2.3
我得到了这个计算精度的方法:
def accuracy_metric(actual, predicted):
correct = 0
for i in range(len(actual)):
if actual[i] == predicted[i]:
correct += 1
return correct / float(len(actual)) * 100.0
如您所见,我在测试集中没有实际值/类标签,那么在预测测试集的类标签后如何计算分类器的准确度?
【问题讨论】:
-
你知道吗,你不能这样计算准确度。尝试将你拥有的训练集分成测试集和训练集然后找到准确度。要找到没有实际目标的预测目标的准确度是毫无意义。
标签: python classification decision-tree