【发布时间】:2016-04-06 08:04:03
【问题描述】:
我从 UCI 机器学习存储库下载了data set。在对数据集的描述中,他们谈到了“预测属性”和“非预测属性”。这是什么意思?如何在数据集中识别它们?
【问题讨论】:
标签: r statistics data-mining data-analysis
我从 UCI 机器学习存储库下载了data set。在对数据集的描述中,他们谈到了“预测属性”和“非预测属性”。这是什么意思?如何在数据集中识别它们?
【问题讨论】:
标签: r statistics data-mining data-analysis
预测属性是可能帮助您预测的属性。
众所周知,非预测属性无济于事。例如记录id、用户号等。唯一键通常属于这一类。
【讨论】:
在我看来,属性似乎与可用数据点的类型有关;因此,预测属性将是可用于“预测”某事的数据点,例如MYCT、MMIN、MMAX、CACH、CHMIN、CHMAX。 “非预测属性”将是供应商名称和型号名称。 PRP 似乎是目标场,线性回归猜测是 ERP。
【讨论】: