【发布时间】:2019-10-14 22:16:31
【问题描述】:
我正面临二元分类问题。我正在使用一些机器学习模型和 Python 3。我注意到某些模型在给定类上的性能比其他模型更好。我想将它们结合起来以提高我的准确性和精确度。我知道在回归问题中这样做的方法,比如预测的加权平均值。但我不确定它在分类问题中是否有意义。而且,您必须知道更好的方法。
这是我的算法,可以帮助我识别特别难以预测的标签:
"""
each value is in {0, 1}
ytrue : real values
ypred : predicted values
"""
def errorIdentifier(ytrue, ypred):
n = len(ytrue)
ytrue = list(ytrue)
ypred = list(ypred)
error = [0,0]
for i in range(n):
if ytrue[i] != ypred[i] :
error[ytrue[i]] += 1
return error
您可以猜到,我需要为我使用的每个模型调用它。
【问题讨论】:
标签: python machine-learning classification