【问题标题】:Clustering Analysis聚类分析
【发布时间】:2018-07-03 18:30:53
【问题描述】:

我想对我的数据集进行聚类分析。

我有一个包含 11 个观察值和每个观察值的 245 个变量的数据集。

我在 R 中找到的所有包都是聚类观察而不是变量。 我想对变量进行聚类分析。

如何使用变量进行聚类。

【问题讨论】:

  • 变量由观察组成。没有观测值的变量有什么意义?我的观点是,如果变量不包含观察值,你将如何测量它? @品种

标签: r cluster-analysis


【解决方案1】:

尝试psych 包中的iclust() 函数以及ClustOfVar 包中的hclustvar()。这些执行变量的聚类,而不是观察的聚类。

【讨论】:

  • igraph 包中还有一个clusters() 函数。
  • 很高兴知道。
【解决方案2】:

转置您的数据。

那么你的变量就是观察,观察变成变量。

【讨论】:

  • 转置数据?我认为这在统计上是不正确的。请解释这个概念的有效性@Anony-Mousse
  • 为什么统计上不正确?它不会更改值。 t() 甚至为你切换行名和列名。
  • @Annony-Mousse,谢谢你的解释。我的错,我没有检查功能 t() 的小插图。我只是这样做并同意。它切换行名和列名,一种重塑数据集的类型。
  • 这样你就可以很容易地对以前的变量进行聚类,对吧?
  • 不,但您似乎甚至不想尝试。在我看来,这通过内置函数很好地解决了您的问题..
猜你喜欢
  • 1970-01-01
  • 2017-05-12
  • 2018-06-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-04-14
相关资源
最近更新 更多