【发布时间】:2016-03-05 21:02:05
【问题描述】:
我是机器学习和自然语言处理方面的新手。
我总是对这三个术语感到困惑?
据我了解:
class:我们模型输出的各种类别。给定一个人的名字,确定他/她是男性还是女性?
假设我正在使用朴素贝叶斯分类器。
我的特征和参数是什么?
还有,上述单词的别名有哪些,可以互换使用。
谢谢
【问题讨论】:
标签: machine-learning terminology
我是机器学习和自然语言处理方面的新手。
我总是对这三个术语感到困惑?
据我了解:
class:我们模型输出的各种类别。给定一个人的名字,确定他/她是男性还是女性?
假设我正在使用朴素贝叶斯分类器。
我的特征和参数是什么?
还有,上述单词的别名有哪些,可以互换使用。
谢谢
【问题讨论】:
标签: machine-learning terminology
让我们以一个人的性别分类为例。你对类的理解是正确的!给定一个输入观察,我们的朴素贝叶斯分类器应该输出一个类别。类就是那个类别。
特征:朴素贝叶斯分类器或任何通用 ML 分类算法中的特征是我们选择定义输入的数据点。对于一个人的例子,我们不可能输入一个人的所有数据点;相反,我们选择一些特征来定义一个人(比如“身高”、“体重”和“脚尺寸”)。具体来说,在Naive Bayes Classifier 中,我们做出的关键假设是这些特征是独立的(它们不会相互影响):一个人的身高不影响体重不影响脚的大小。这个假设可能正确,也可能不正确,但对于朴素贝叶斯,我们假设它是正确的。在输入只是名称的示例的特定情况下,特征可能是字母的频率、元音的数量、名称的长度或后缀/前缀。
参数:朴素贝叶斯中的参数是对我们要分类的任何内容的真实分布的估计。例如,我们可以说大约 50% 的人是男性,男性身高的分布是平均 5' 7" 和标准差 3" 的高斯分布。参数将是 50% 估计值、5' 7" 平均估计值和 3" 标准差估计值。
别名:特征也称为属性。我不知道“参数”有任何常见的替代品。
希望对你有帮助!
【讨论】:
@txizzle 很好地解释了朴素贝叶斯的情况。在更一般的意义上:
类:数据的输出类别。您也可以调用这些类别。您数据上的标签将指向其中一个类(当然,如果这是一个分类问题。)
特征:定义您的问题的特征。这些也称为属性。
参数:您的算法尝试调整的变量以构建准确的模型。
例如,假设您正在尝试根据学生的本科 GPA、考试成绩、推荐分数、项目等各种因素来决定是否录取学生。在这种情况下,上面提到的因素是您的特征/属性,学生是否被录取成为您的 2 个班级,以及决定这些特征如何组合在一起以使您的输出成为您的参数的数字。参数实际代表什么取决于您的算法。对于神经网络,它是突触链接上的权重。同样,对于回归问题,参数是您的特征组合时的系数。
【讨论】:
拿一个简单的线性分类问题-
y={0 if 5x-3>=0 else 1}
这里y是类,x是特征,5,3是参数。
【讨论】:
我只是想添加一个区分属性和特征的定义,因为它们经常互换使用,这样做可能不正确。我引用的是“使用 SciKit-Learn 和 TensorFlow 进行动手机器学习”。
在机器学习中,属性是一种数据类型(例如,“里程”), 虽然一个特征根据上下文有多种含义,但是 通常表示一个属性加上它的值(例如,“里程 = 15,000”)。许多人交替使用属性和特征这两个词, 不过。
【讨论】:
我喜欢“使用 Scikit 和 Tensorflow 进行动手机器学习”(作者 Aurelian Geron)中的定义,其中 属性 = 数据类型(例如,里程) FEATURE = DATA TYPE + VALUE(例如,里程 = 50000)
关于 FEATURE 与 PARAMETER,根据 Geron 书中的定义,我曾经将 FEATURE 解释为变量,将 PARAMETER 解释为权重或系数,例如在下面的模型中 Y = a + b*X
X 是特征 a, b 是参数
但是,在一些出版物中,我看到了以下解释: X 是参数 a, b 是权重
所以,最近,我开始使用以下定义:
FEATURE = RAW DATA 的变量(例如,电子表格中的所有列)
PARAMETER = 模型中使用的变量(即选择模型中的特征之后)
WEIGHT = 模型参数的系数
想法?
【讨论】:
让我们看看这是否有效:)
假设您有一个 Excel 电子表格,其中包含有关特定产品的数据以及其中存在 7 个原子元素。
[product] [calcium] [magnesium] [zinc] [iron] [potassium] [nitrogen] [carbon]
特征 - 是除product 之外的每一列,因为所有其他列都是独立的、共存的,对目标(即产品)具有可衡量的影响。您甚至可以选择将其中一些组合起来称为Essential Elements,即降维以使其更适合分析。术语“降维”在这里仅用于解释,不要与无监督学习中的 PCA 技术混淆。特征与监督学习技术相关。
现在,想象一台很酷的机器,它能够查看上面的数据并推断出产品是什么。
参数就像是特定于该机器的杠杆和旋塞阀,您可以使用它,并确保如果机器说“这是肥皂渣”,它真的/真的是。如果您考虑自己进行飞镖盘练习,您会对自己做些什么来接近靶心(平衡偏差/方差)?
超参数类似于参数,但在我们正在谈论的这台机器之外。如果机器零件/机械元件由特定的化合物制成,例如:碳纤维还是镁合金?这将如何改变机器可以/不能做得更好的地方?
我认为这是对事物的过度简化,但希望可以接受?
【讨论】: