有没有办法访问或导出 r 图中的标签编号？答案

【问题标题】：Is there a way to access or export the label numbers in an r plot?有没有办法访问或导出 r 图中的标签编号？
【发布时间】：2015-05-12 18:03:50
【问题描述】：

我有一个图，其中 x 是测试 a，y 是另一个测试 b。每个学生都接受两次测试。每个点代表一个学生在 x 和 y 上的“后减前”分数。如您所见，我为绘图分配了标签，但我想将 id 导出到绘图的不同部分。有没有办法做到这一点？

【问题讨论】：

“我想在剧情的不同部分导出 id”是什么意思？您是否正在寻找一种聚类算法来识别进步的学生和没有进步的学生？
我有他们的个人分数，我想以某种方式提取情节上的组。例如，情节上有两个大群体，我想知道这两个群体的 ID。聚类算法是什么意思？我认为这也会有帮助。实际上我有四个测试，我试图将学生分组到类似的成长模式。你能给我一个你的算法的例子吗？谢谢！@RockScience
William 你应该做一些关于聚类的研究，有很多方法可以从数据集中识别 id 组。 statmethods.net/advstats/cluster.html 我认为在你的情况下，一个简单的 k-mean 集群可以工作。
我建议将此问题移至 stats.stackexchange.com
示例数据和示例输出也非常有用。

标签： r plot cluster-analysis k-means

【解决方案1】：

如果myData 是您的数据集，您可以使用kmeans 算法来识别每个组：（确保x 和y 之前相应地居中并归一化）

myData <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
       matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(myData) <- c("x", "y")
(cl <- kmeans(myData, 2))
plot(myData, col = cl$cluster)
points(cl$centers, col = 1:2, pch = 8, cex = 2)

【讨论】：

【解决方案2】：

补充@RockScience 的答案，

也许更好的方法是首先确定集群的数量，而不是将集群的数量分配为 2，这样您就有可能获得确切的人群而不是将整个人群分成 2集群。

关于如何查找集群数量的链接： find the number of clusters

【讨论】：

【解决方案3】：

为什么不按阈值选择？

您对特定范围内的学生感兴趣。

那么为什么不将范围形式化，并选择其中 0

【讨论】：