【问题标题】:Visualizing PCA with large number of variables in R using ggbiplot使用 ggbiplot 在 R 中可视化具有大量变量的 PCA
【发布时间】:2020-05-08 23:30:10
【问题描述】:

我正在尝试可视化包含 87 个变量的 PCA。

prc <-prcomp(df[,1:87], center = TRUE, scale. = TRUE)
ggbiplot(prc, labels = rownames(df[,1:87]), var.axes = TRUE)

当我创建双标图时,许多向量相互重叠,无法读取标签。我想知道是否有任何方法一次只显示一些标签。例如,我认为如果我可以创建几个单独的双标图,每个双标图只显示向量上标签的一个子集,那将会很有用。

This question 似乎密切相关,但我不知道它是否转化为最新版本的 ggbiplot。我也不确定如何修改原始功能。

【问题讨论】:

    标签: r ggplot2 data-visualization ggbiplot biplot


    【解决方案1】:

    一个潜在的解决方案是使用factoextra 包来可视化您的 PCA 结果。 fviz_pca_biplot() 函数包含一个 repel 参数。当repel = TRUE 时,绘图标签会展开以尽量减少重叠。还有文档中提到的select.var选项,比如select.var = list(contrib=5)只显示5个最有影响的向量。还有一个select.var = list(name) 选项,似乎允许指定您想要显示的特定变量子集。

    # read data
    df <- mtcars[, c(1:7,10:11)]
    
    # perform PCA
    library("FactoMineR")
    res.pca <- PCA(df, graph = FALSE)
    
    # visualize
    library(factoextra)
    fviz_pca_biplot(res.pca, repel = TRUE, select.var = list(contrib = 5))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-01-21
      • 2019-10-04
      相关资源
      最近更新 更多