【发布时间】:2016-07-27 12:49:04
【问题描述】:
我为一个项目做了一个层次集群。 我有 20 个变量中的每一个有 300 个观察值。 我对所有变量进行了索引,使每个变量都介于 0 和 1 之间,值越大越好。
我使用以下代码创建了一个聚类图。
d_data <- dist(all_data[,-1])
d_data_ind <- dist(data_ind[,-1])
hc_data_ind <- hclust(d_data_ind, method = "complete")
dend<- as.dendrogram(hc_data_ind)
plot(dend)
现在节点的标签在行名中,数字 1 到 300(见上图)。在分析过程中,我删除了数据框中标有“地理”的第一列(见下图),因为它们是文本中的城市名称,会搞砸分析。但我真的需要在集群图的正确位置获取城市名称,因为我需要根据结果选择城市列表。
我应该写什么代码将“地理”列中的城市名称插入到这个图中,对应于它们的行名?
从数据框(下图)可以看出,所有城市名称都是按字母顺序排列的,按升序排列,就像行名称一样。我确信将城市名称放到情节中并不难,只是通过谷歌搜索和四处询问都找不到。
【问题讨论】:
-
请习惯于提供可重现的代码,准备好复制-粘贴-运行,以方便访问者和读者。 (例如,
all_data没有给出;数据集的屏幕截图没有帮助;提供dput(my_data)的结果是可行的方法。) -
谢谢你的建议,我以后会练习的
标签: r hierarchical-clustering dendrogram unsupervised-learning dendextend