【发布时间】:2020-02-09 20:48:23
【问题描述】:
我有一个来自 create ML 的机器学习分类器。该模型使用 3400 个样本进行训练,总体而言其准确度令人印象深刻。然而,该模型经常做出错误的预测,我似乎无法弄清楚如何将其添加到模型中,因此它对其中一些错误预测没有如此高的信心。我如何/我可以用这个分类错误的新数据重新训练模型,它不属于这个分类?我应该创建一个新的分类文件夹并将这些错误的分类添加到其中,还是有办法训练模型以作为非分类类型传入,以便尝试了解它们之间的区别?
【问题讨论】:
-
你能提供更多细节吗
-
我不确定我还能提供什么详细信息。但基本上我的 ML 模型正在做出我不希望它做出的预测。我如何重新训练模型告诉它这个示例不是这种类型的分类
-
您在这里对您的问题进行了非常广泛的描述。当您说“它的准确度令人印象深刻”时,是否还查看了其他指标?精确度、召回率、混淆矩阵?您的数据的特征如何?你的数据类不平衡吗?如果您的数据由 99.9% 的 0 类和只有 0.1% 的 1 类组成,那么您的模型通过仅预测 0 类具有 99.9% 的准确度也就不足为奇了。您实际上有多少类?
-
您是否查看过错误预测的数据点?也许他们之间有联系?也许他们被贴错标签了。
-
我有 1,2,3 三个班。类型 1 有 1578 个样本,类型 2 有 1231 个,类型 3 有 714 个样本。训练 - (类型 1)精度 100% 召回率 99%,(类型 2)精度 98% 召回率 100%,(类型 3)精度 98% 召回率 97%。验证 - (类型 1)精度 100% 召回率 99%,(类型 2)精度 97% 召回率 100%,(类型 3)精度 95% 召回率 93%。测试 - (类型 1)精度 100% 召回率 97%,(类型 2)精度 99% 召回率 100%,(类型 3)精度 94% 召回率 99%。
标签: xcode machine-learning classification createml mlmodel