在 R 中使用 pegas 执行 tajD 测试的问题答案

【问题标题】：problems executing tajD test using pegas in R在 R 中使用 pegas 执行 tajD 测试的问题
【发布时间】：2017-09-11 15:57:51
【问题描述】：

我正在尝试从 SNP 数据 (~4000SNPs) 计算 tajD。我有 fasta 和 vcf 文件，最初尝试使用我的 fasta 文件。在帮助下，我明白了我有一个可以从文件中采样的脚本，但是我需要将 fasta 文件拆分为单独的群体。我害怕这样做（尽管我必须给出我现在遇到的错误），所以我分阶段使用我的 vcf 文件，并希望改用它。我正在使用 R 包 pegas，并收到以下错误。

> rm(list=ls(all=T))
> library("ape")
> library("ade4")
> library("adegenet")
> library("pegas")

> b8c18FromVcf <- read.vcf("b8c18_2phased.vcf")

文件显然尚未访问：扫描文件 b8c18_2phased.vcf 3.194102 / 3.194102 Mb 完毕。读取 4074 / 4074 位点。完成。

获得单倍型

> b8c18haplos <- haplotype(b8c18FromVcf)

分析个人编号。 186 / 186

来自haplos的tajD

> tajd <- tajima.test(b8c18haplos)

警告信息：在 tajima.test(b8c18haplos) 中： Tajima 测试至少需要 4 个序列

我将在此处附加指向我的分阶段和非分阶段文件的链接。 https://drive.google.com/open?id=0B6qb8IlaQGFZTmQ1YXRVbnFSRzA https://drive.google.com/open?id=0B6qb8IlaQGFZQm9HZjZSUkE3NEU

有什么想法吗？

最后，我想知道是否有办法在 tajD 命令中对人群进行子集化。我在同一个 vcf 文件中有 7 个人口，我应该分别计算每个人口的 tajD。如果没有，什么是子集 vcfs 的最佳工具。我已经对此进行了大量的谷歌搜索，但似乎没有一个是直截了当的。

感谢，

【问题讨论】：

标签： r bioinformatics vcf-variant-call-format

【解决方案1】：

pegas 的开发者回复我说 Tajima 的 D 需要 DNA 序列。它不能使用 vcf 文件执行，即使它是分阶段的。

【讨论】：