【发布时间】:2016-10-19 01:49:19
【问题描述】:
我不知道从哪里开始。我的任务是使用 R 中内置的 IRIS 数据集:
编写一段 R 代码,使用最近邻分类器 (NN)[1] 为每个 OBSERVATIONS(四维)分配一个类标签。使用 Part A 作为参考数据库(观察和分类标签),使用 Part B 作为测试集。假设您不知道 B 部分的类标签,对于 B 部分的每个观测值,找到离 A 部分最近的观测值,并将其类标签分配给 A 部分的观测值。
计算并返回每类准确度(每类正确分类的观察数除以观察总数)。
我为第一部分编写的代码非常简单:
newData = iris
evenRows.A <- newData[seq(2, nrow(newData), 2),] #SELECT EVEN ROWS
oddRows.B <- newData[seq(1, nrow(newData), 2),] #SELECT ODD ROWS. This is the testing set
任何关于类标签的帮助都将不胜感激。
编辑:格式化的 R 代码
【问题讨论】:
标签: r classification