【发布时间】:2019-03-07 20:26:06
【问题描述】:
我使用一个训练源 CSV 文件生成一个主数据框,我将其分成 80% 的训练数据和 20% 的测试数据。在拆分数据之前,我对数据框的所有列进行了规范化,以使所有独立和依赖数据都在 0 和 1 之间,包括目标(因变量)。在训练后的结果中,我的预测值都在 0 和 1 之间。然后我对单个预测进行反规范化,以查看我得到的值并与预期值进行比较。我的问题是我正在通过 MSE(均方误差)和 RMSE(均方根误差)来测量模型。我的训练数据上的 MSE 和 RMSE 分别为 0.03 和 0.16。这些可接受的值是否具有标准化数据源?如果不是,对于我的标准化数据源,什么是可接受的值?或者我应该标准化我的数据,因为我的自变量之间的范围差异没有很大差异?如果我不规范化我的数据,我应该使用规范化 RMSE 来解释指标吗?如果我在不对训练和测试数据进行归一化时对 RMSE 进行归一化,那么归一化 RMSE 的可接受值是多少?提前感谢您的任何回复。
【问题讨论】:
标签: tensorflow linear-regression