【问题标题】:should I get the same accuracy in the test set and the training set我应该在测试集和训练集中获得相同的准确性吗
【发布时间】:2020-03-23 05:04:40
【问题描述】:

我是机器学习的新手,我已经建立了一个模型来预测客户是否会在下个月订阅。我在训练集上得到 73.4,在测试集上得到 72.8。可以吗?还是我有过度拟合?

【问题讨论】:

  • 没关系。它们不应该是相同的,这不是过拟合。
  • 没关系。它们不应该是相同的,这不是过拟合。

标签: machine-learning


【解决方案1】:

没关系。 当训练集的准确率较高而测试集的准确率较低时会发生过度拟合(存在边际差异)。

这就是过拟合的样子。

Train accuracy: 99.4%
Test accuracy: 71.4%

但是,您可以使用不同的模型和特征工程来提高准确性

【讨论】:

    【解决方案2】:

    我们称之为过拟合,如果训练数据的准确率异常高(大于95%)而测试数据的准确率非常低(小于65%) 。 在您的情况下,训练和测试的准确性几乎相似。因此没有过度拟合。 尝试更多的测试数据,检查准确率是否下降。您也可以尝试改进模型

    1. 尝试不同的算法
    2. 增加训练数据的大小
    3. 尝试 K 折交叉验证
    4. 超参数调优
    5. 使用正则化方法
    6. 标准化特征变量

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-06-13
      • 2020-07-30
      • 2019-12-09
      • 1970-01-01
      • 2021-10-03
      • 2019-08-21
      • 2017-08-18
      相关资源
      最近更新 更多