【发布时间】:2020-03-28 16:51:48
【问题描述】:
【问题讨论】:
标签: machine-learning data-science evaluation auc
【问题讨论】:
标签: machine-learning data-science evaluation auc
我认为结果表明模型可能过拟合或欠拟合。最好的方法是使用训练测试拆分并检查测试数据的结果。
另一个原因可能是您的数据量很小,并且两个模型都能够过拟合,因此您肯定需要进行训练-测试拆分。
希望这会有所帮助。
【讨论】:
如果您在没有任何调整的情况下看到如此高的准确度,那么大多数情况下基线也是超高的。
如果您想进行良好的比较,您可以构建一个虚拟分类器,它总是预测主要类别(二元分类中的类别是 0 和 1),因此您将始终预测 1,然后进行准确性测试。这将是你的基线,如果这也是 0.95,你就知道这个数据集是不平衡的,你的分类器不是一个好的结果。
【讨论】: