【发布时间】:2015-03-27 10:50:59
【问题描述】:
我目前正在使用 PDB 数据集,我对残基的大小(每个残基的原子数)感兴趣。我意识到原子数 -len(residue.child_list) - 与不同蛋白质中的残基不同,即使是相同的残基。例如:残基“LEU”在一种蛋白质中有 8 个原子,但在另一种蛋白质中有 19 个!
我的猜测是 PDB 或 PDBParser() 中的错误,但差异很大!
以分子 3OQ2 为例:
r = model['B'][88]
r1 = model['B'][15] # residue at chain B position 15
In [287]: r.resname
Out[287]: 'VAL'
In [288]: r1.resname
Out[288]: 'VAL'
但是
In [274]: len(r.child_list)
Out[274]: 16
In [276]: len(r1.child_list)
Out[276]: 7
因此,即使在单个分子内,原子数也存在差异。我想知道这在生物学上是否正常,或者是否有问题。谢谢。
强文本
【问题讨论】:
-
你能举个例子吗?我一直在使用 Bio.PDB 解析器,我可以说它对于 PDB 文件是可靠的。尝试测试 r.is_disordered() 以检测无序原子(PDB 中备用位置的原子)或 list(r)。
-
我对两个残基都尝试了 r.is_disordered(),结果都是'0'。
标签: bioinformatics biopython protein-database