【发布时间】:2018-04-20 16:22:43
【问题描述】:
我需要一些关于 R 编码的帮助。
数据集 Glass 由 214 行数据组成,每行对应一个玻璃样品。每行由 10 列组成。当被视为一个分类问题时,第 10 列 (类型)指定每个观察/实例的类。其余列是可能用于推断第 10 列的属性。这是第一行的示例
RI Na Mg Al Si K Ca Ba Fe Type
1 1.52101 13.64 4.49 1.10 71.78 0.06 8.75 0.0 0.0 1
首先,我转换了第 10 列,以便 R 将其解释为一个因子而不是整数值。
现在我需要为所有观察创建一个带有索引的向量(必须具有值 1-214)。这需要为朴素贝叶斯创建训练数据。我知道如何创建一个具有 214 个值的向量,但不知道如何创建一个具有特定索引的数据帧观察值。
如果这样做有助于为朴素贝叶斯设置训练数据,谢谢
【问题讨论】:
-
另一个注意事项:第 10 列已被转换,因此它现在被解释为一个因子而不是一个整数
标签: r vector naivebayes