【问题标题】:Subtrees of Phylogenetic Trees in BioPythonBioPython中系统发育树的子树
【发布时间】:2016-08-19 09:35:57
【问题描述】:

我有一个 newick 格式的系统发育树。我想根据终端节点的标签(因此基于物种列表)拉出一个子树。我正在使用的树的副本可以在这里找到:http://hgdownload.soe.ucsc.edu/goldenPath/dm6/multiz27way/dm6.27way.nh

目前我已经像这样使用 BioPython 在树中阅读:

from Bio import Phylo
#read in Phylogenetic Tree
tree = Phylo.read('dm6.27way.nh', 'newick')
#list of species of interest
species_list = ['dm6', 'droSim1', 'droSec1', 'droYak3', 'droEre2', 'droBia2', 'droSuz1', 'droAna3', 'droBip2', 'droEug2', 'droEle2', 'droKik2', 'droTak2', 'droRho2', 'droFic2']

我如何只提取species_list中物种的子树?

【问题讨论】:

  • 澄清一下,您想要最小的树,其中包含您的物种列表中的所有物种?那么这棵树的根节点将是最近的共同祖先还是列表中的所有物种?
  • 哦,我应该澄清更多。子树将仅包含列表中的所有物种。您下面的解决方案正是我想要的。

标签: python tree bioinformatics biopython


【解决方案1】:

好的,假设您想要拥有物种列表中所有物种的最小树,您希望这棵树的根节点成为列表中所有物种的最近共同祖先 (MRCA),谢天谢地已经在 Phylo 中实现:

from Bio import Phylo

#read in Phylogenetic Tree
tree = Phylo.read('dm6.27way.nh', 'newick')
#list of species of interest
species_list = ['dm6',
                'droSim1',
                'droSec1',
                'droYak3',
                'droEre2',
                'droBia2',
                'droSuz1',
                'droAna3',
                'droBip2',
                'droEug2',
                'droEle2',
                'droKik2',
                'droTak2',
                'droRho2',
                'droFic2']

common_ancestor = tree.common_ancestor(species_list)
Phylo.draw_ascii(common_ancestor)

输出:

Clade
                                           ___ dm6
                                       ___|
                                      |   | , droSim1
                                      |   |_|
                            __________|     | droSec1
                           |          |
                           |          |  _____ droYak3
                          ,|          |_|
                          ||            |____ droEre2
                          ||
                          ||      _______ droBia2
                          ||_____|
                          |      |_____ droSuz1
                          |
                        __|                                  _______ droAna3
                       |  |_________________________________|
                       |  |                                 |________ droBip2
                       |  |
                       |  |___________________ droEug2
                       |
                       |_____________ droEle2
                      ,|
                      ||______________________________ droKik2
                    __||
                   |  ||______________ droTak2
___________________|  |
                   |  |____________ droRho2
                   |
                   |_______________ droFic2

【讨论】:

【解决方案2】:

不要使用 BioPython,而是使用 ete3

from ete3 import Tree
t = Tree('dm6.27way.nh')
t.prune(species_list, preserve_branch_length=True)
t.write()

从文档中,

从 2.2 版开始,此函数还包括 preserve_branch_length 标志,它允许从树中删除节点,同时保持剩余节点之间的原始距离。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多