【发布时间】:2020-03-09 18:23:53
【问题描述】:
假设我们有一个火车数据集,其中的列是浴室、卧室、平方英尺生活、景观和其他一些特征,并且在那里定义了 价格。 在测试数据集中,除了价格之外,上述所有特征都存在。 我们怎么能从数据集中预测价格?
【问题讨论】:
标签: machine-learning nlp data-science data-analysis
假设我们有一个火车数据集,其中的列是浴室、卧室、平方英尺生活、景观和其他一些特征,并且在那里定义了 价格。 在测试数据集中,除了价格之外,上述所有特征都存在。 我们怎么能从数据集中预测价格?
【问题讨论】:
标签: machine-learning nlp data-science data-analysis
没有标签会使您的测试集毫无用处,因此您可以将标签集(您在此处称为训练数据)划分为训练和测试。这样,您将不会将所有数据用于训练,而测试部分将用于验证您的模型。
【讨论】:
您可以使用您拥有的训练集训练模型,但如果您没有测试集的标签(基本事实),您将无法验证您的模型(您已训练的模型)的性能带有训练集)。
【讨论】: