【发布时间】:2019-10-14 03:06:13
【问题描述】:
假设我有这个数据集,data1(后缩放和 PCA)。
F1 F2 F3 F4 F5 ... F21
1 0.28 2.29 5.64 1.04 3.92 1065
2 0.26 1.28 4.38 1.05 3.40 1050
3 0.30 2.81 5.68 1.03 3.17 1185
4 0.24 2.18 7.80 0.86 3.45 1480
5 0.39 1.82 4.32 1.04 2.93 735
.
.
.
1000 0.34 1.97 6.75 1.05 2.85 1450
我使用以下方法对数据集进行了 k-means 聚类分析:
Clusters <- kmeans(data1, 5, nstart = 25)
data1 <- data.frame(data1)
data1 <- data1 %>% mutate(Cluster = Clusters$cluster)
然后我从另一个数据集中插入了字符类型的行名:
rownames(data1) <- data2$Name
然后,为了避免标签重叠,我使用了
p1 <- autoplot(Clusters, data = data1, frame = TRUE, label = F, x=1, y=2)
p2 <- p1 + geom_text_repel(aes(label = rownames(data1)))
由于我有超过 500 个数据点,因此标签可能会重叠并且无法读取。我想知道当标签仅在您单击或悬停在数据点上时显示时是否有标签方法。或者欢迎任何其他解决方案。谢谢
【问题讨论】:
-
请分享一个可重现的例子。
-
您打算如何使用或显示交互式图形?这需要将其扩展到 plotly、rcharts、highcharts、d3 等。有很多选择,但我们不知道您想要哪个,这使得这是一个边界推荐问题,这在 SO 上是题外话。跨度>
标签: r plot label cluster-analysis ggrepel