【问题标题】:Underlying concept of regression for beginner (Machine Learning)初学者回归的基本概念(机器学习)
【发布时间】:2020-07-04 18:46:16
【问题描述】:

我是机器学习的新手。如果问题看起来有点混乱,我深表歉意。这个框架 (https://www.tensorflow.org/tutorials/keras/regression) 应用神经网络来解决回归问题,我有几个问题。

数据集的尾部如上所示。最后 3 列使用 one-hot 编码。

检查数据如上所示。问题 1) 为什么我们需要这样做?

检查后,它将特征与标签分开。问题 2) 我理解回归中的概念 y = mx1 + mx2 + ... + c。我们有 MPG、气缸、位移、马力等作为我们的特征 (x1,x2,x3,x4...),但我们在数据集中没有标签 (y)。在这种情况下,我们应该如何进行监督训练? “将标签与特征分开”是什么意思?

非常感谢您阅读这个问题!

【问题讨论】:

    标签: python machine-learning neural-network regression linear-regression


    【解决方案1】:

    标签

    标签是数据应该是什么。
    在您的情况下,您的标签似乎是 MPG,因此您正在从数据中学习 MPG。
    对象 #1 的 MPG 为 27,对象 #2 的 MPG 为 44,等等。

    特点

    特征就是数据的含义:
    对象#1 可以是具有以下条目的矩阵:{0,1;1,0},对象#2 可以是具有以下条目的矩阵:{1,1;1,0} 等等。

    请注意,标签和特征在代码中可以有不同类型的表示;了解概念上的差异很重要。

    特征和标签之间的联系

    您希望算法了解看起来有些不同的矩阵具有特定的 MPG,而看起来略有不同的矩阵具有另一个 MPG。

    为此,您需要将标签(对象类型,在本例中为 MPG)与特征(对象本身,在本例中为每个对象的数据,不包括 MPG)分开,以便学习和预测数据中的 MPG。

    【讨论】:

    • 谢谢 =] 我明白了。还有一件事,为什么我们需要进行问题1中提到的数据检查?目的是什么?
    • 这是一个pythonpop:返回值为MPG值,从特征(dataset)数组中移除。
    猜你喜欢
    • 2014-09-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-02-09
    • 2013-11-21
    相关资源
    最近更新 更多