【问题标题】:Combine multiple VCF files into one large VCF file将多个 VCF 文件合并为一个大 VCF 文件
【发布时间】:2020-12-26 22:16:39
【问题描述】:

我有一份来自特定种族的 VCF 文件列表,例如美洲印第安人、中国人、欧洲人等

在每个种族下,我有大约 100 多个文件。

目前,我计算了一个文件的VARIANT QC 指标,例如call_raten_het 等,如冰雹教程中所示(参考下图)

image is here

但是,现在我想为每个种族创建一个文件,然后计算 VARIANT_QC 指标。

我已经提到了这个post 和这个post,但我认为这不能解决我的问题

如何对特定种族下的所有文件执行此操作?

可以帮我解决这个问题吗?

有没有hail/python/R/other tools 的方法可以做到这一点?

【问题讨论】:

    标签: bioinformatics vcftools bcftools hail vcf-variant-call-format


    【解决方案1】:

    您可以使用Variant Transforms 来实现此目标。 Variant Transforms 是一个用于解析 VCF 文件并将其导入BigQuery 的工具。它还可以执行反向转换:将存储在 BigQuery 表中的变体导出到 VCF 文件。所以基本上你需要:multiple VCF files -> BigQuery -> Single VCF file

    变体变换可以轻松处理multiple input files。它还可以对merge same variants 跨多个文件执行更复杂的逻辑到同一记录中。将您的变体全部加载到 BigQuery 后,您可以export them to VCF file

    请注意,Variant Transforms 创建一个separate table for each chromosome 以优化查询成本。您可以轻松地为每条染色体创建一个 VCF 文件,然后将它们合并在一起以创建一个。

    如果您需要有关此任务的帮助,请联系 Variant Transforms team

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-11-05
      • 2022-06-10
      • 2021-05-28
      • 1970-01-01
      • 1970-01-01
      • 2011-12-30
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多