【问题标题】:Is there a way to access or export the label numbers in an r plot?有没有办法访问或导出 r 图中的标签编号?
【发布时间】:2015-05-12 18:03:50
【问题描述】:

我有一个图,其中 x 是测试 a,y 是另一个测试 b。每个学生都接受两次测试。每个点代表一个学生在 x 和 y 上的“后减前”分数。如您所见,我为绘图分配了标签,但我想将 id 导出到绘图的不同部分。有没有办法做到这一点?

【问题讨论】:

  • “我想在剧情的不同部分导出 id”是什么意思?您是否正在寻找一种聚类算法来识别进步的学生和没有进步的学生?
  • 我有他们的个人分数,我想以某种方式提取情节上的组。例如,情节上有两个大群体,我想知道这两个群体的 ID。聚类算法是什么意思?我认为这也会有帮助。实际上我有四个测试,我试图将学生分组到类似的成长模式。你能给我一个你的算法的例子吗?谢谢!@RockScience
  • William 你应该做一些关于聚类的研究,有很多方法可以从数据集中识别 id 组。 statmethods.net/advstats/cluster.html 我认为在你的情况下,一个简单的 k-mean 集群可以工作。
  • 我建议将此问题移至 stats.stackexchange.com
  • 示例数据和示例输出也非常有用。

标签: r plot cluster-analysis k-means


【解决方案1】:

如果myData 是您的数据集,您可以使用kmeans 算法来识别每个组:(确保xy 之前相应地居中并归一化)

myData <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
       matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(myData) <- c("x", "y")
(cl <- kmeans(myData, 2))
plot(myData, col = cl$cluster)
points(cl$centers, col = 1:2, pch = 8, cex = 2)

【讨论】:

    【解决方案2】:

    补充@RockScience 的答案,

    也许更好的方法是首先确定集群的数量,而不是将集群的数量分配为 2,这样您就有可能获得确切的人群而不是将整个人群分成 2集群。

    关于如何查找集群数量的链接: find the number of clusters

    【讨论】:

      【解决方案3】:

      为什么不按阈值选择?

      您对特定范围内的学生感兴趣。

      那么为什么不将范围形式化,并选择其中 0

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2019-08-29
        • 1970-01-01
        • 1970-01-01
        • 2020-01-14
        • 2016-03-24
        • 2021-10-18
        • 2021-05-10
        相关资源
        最近更新 更多