【发布时间】:2021-04-30 06:23:07
【问题描述】:
我需要一个 PCA 图来显示数据是否以及如何按人口(AFR_ACB、AFR_ASW 等)聚类。我还需要每个人口的不同颜色和人口颜色的图例。如果我可以为所有非洲人口、美国人口、亚洲人和欧洲人添加一个框架也很好,因为我的真实数据由所有这些人口组成
我从结果文件创建的 csv (TLR9.csv) 文件中有以下格式的数据。实际上,有 26 列(26 个总体)和 1522 行。
nuc_pos AFR_ACB AFR_ASW AMR_PUR AMR_PEL EAS_CHS EAS_JPN EUR_FIN EUR_CEU AMR_MXL AMR_PEL AMR_PUR EAS_CDX EAS_CHB EAS_CHS
42809473 0 0 0 0 0 0 0 0 0 0 0 0 0.00971 0
42809498 0.01042 0 0.0201 0.00885 0 0.03488 0.00926 0 0 0 0 0 0 0
42809524 0 0 0 0 0.0201 0 0.00926 0 0 0 0 0 0 0
42809625 0 0 0 0 0 0 0 0.08192 0.01563 0.02339 0.02857 0 0 0
42809638 0 0 0 0.00885 0 0 0 0 0 0 0 0 0 0
42809715 0.30628 0.20485 0.34743 0.36531 0.19059 0.36199 0.34729 0.02116 0.01563 0 0.06536 0 0 0
42809846 0 0 0 0 0 0 0 0 0 0 0 0 0.00971 0.00952
42809910 0 0 0 0 0 0 0 0 0 0.01176 0 0 0 0
42809911 0 0 0 0 0 0 0 0 0 0 0 0 0 0
42809964 0.30628 0.20485 0.34743 0.36531 0.20638 0.38016 0.35241 0.02116 0.01563 0 0.06536 0 0 0
42810034 0.30628 0.20485 0.34743 0.36531 0.19059 0.34918 0.34729 0.02116 0.01563 0 0.06536 0 0 0
42810082 0 0 0 0 0 0.02339 0 0 0 0 0 0 0 0
42810098 0 0 0 0 0 0 0 0 0 0 0 0 0 0
42810103 0 0 0 0 0.0101 0 0 0 0 0 0 0 0 0
42810184 0 0 0 0 0.03 0 0 0 0 0 0 0 0 0
42810189 0.30628 0.20485 0.34743 0.36531 0.19853 0.34918 0.34729 0.02116 0.01563 0 0.06536 0 0 0
42810233 0 0 0 0 0 0 0 0 0 0 0 0 0 0
我使用以下代码制作了 PCA 图:
df <- read.csv('TLR9.csv')
pca_res <- prcomp(df, scale. = TRUE)
autoplot(pca_res, data = df, loadings = TRUE, loadings.label = TRUE, frame = TRUE, label = TRUE, shape = FALSE, label.size = 2, loadings.label.size = 3)
对于此类分析,输入文件格式是否正确?把26个种群全部作为主成分也对吗?
我尝试了其他 R 包,其中的教程更好地解释了如何在 R 上制作 PCA,但它们与我拥有的 R 版本不兼容。所以,我尝试了这个,它可以工作,但我不确定输出是否应该是这样。
这是我第一次做 pca,我对 R 不是很熟悉。任何帮助都将不胜感激。提前致谢!
【问题讨论】:
-
我的回答能回答你的问题吗?
-
嗨,安迪。很抱歉,我根本无法测试代码。我尝试安装 FactoMineR 包,但出现以下错误: install.packages 中的警告:安装包 'FactoMineR' 的退出状态非零 下载的源包位于 '/tmp/RtmpHtrBPj/downloaded_packages' 警告消息:1 : 在 .rs.normalizePath(defaultLibraryPath) : path[1]="/home/aahm/R/x86_64-pc-linux-gnu-library/4.0": 没有这样的文件或目录 2: 在 .rs.normalizePath(libPaths ) : path[1]="/home/aahm/R/x86_64-pc-linux-gnu-library/4.0": 没有这样的文件或目录。
-
我搜索了为什么会有这个,我发现某处 FactoMineR 不能与 R 版本 3.4 一起使用。我卸载了 R 并重新安装了 3.5 版,但我也遇到了这个问题。所以,我这样做了: sudo apt --fix-broken install sudo apt autoremove sudo apt-get update sudo apt-get upgrade sudo apt-get install r-base-dev 我发现自己又遇到了同样的问题。您能否推荐另一个适用于 R 3.4 版的软件包?谢谢。
-
看来您可能正在运行一个非常旧的 R 版本(甚至 3.5 都是旧版本)。再次尝试删除 R,转到下面的网站链接,更新到最新版本,然后重试。我正在运行 R 版本 4.0.2 (2020-06-22) r-project.org
-
我已经在我的电脑上重新安装了 R 4.0.3,但我仍然无法安装该软件包。我收到以下错误:错误:依赖项 'rio' 不适用于包 'car' * 删除 '/home/aahm/R/x86_64-pc-linux-gnu-library/4.0/car' * 安装 source package 'shiny' ... ** package 'shiny' 成功解压并检查 MD5 和 ** 使用分阶段安装 ** R ** inst ** 字节编译并准备延迟加载的包 ** 帮助 * ** 安装帮助索引 *** 复制数字 ** 测试安装的包是否保留临时安装路径的记录 * 完成(闪亮