【问题标题】:BioPython: Residues size differ from positionBioPython:残基大小与位置不同
【发布时间】:2015-03-27 10:50:59
【问题描述】:

我目前正在使用 PDB 数据集,我对残基的大小(每个残基的原子数)感兴趣。我意识到原子数 -len(residue.child_list) - 与不同蛋白质中的残基不同,即使是相同的残基。例如:残基“LEU”在一种蛋白质中有 8 个原子,但在另一种蛋白质中有 19 个!

我的猜测是 PDB 或 PDBParser() 中的错误,但差异很大!

以分子 3OQ2 为例:

r = model['B'][88]
r1 = model['B'][15] # residue at chain B position 15

In [287]: r.resname
Out[287]: 'VAL'
In [288]: r1.resname
Out[288]: 'VAL'

但是

In [274]: len(r.child_list)
Out[274]: 16
In [276]: len(r1.child_list)
Out[276]: 7

因此,即使在单个分子内,原子数也存在差异。我想知道这在生物学上是否正常,或者是否有问题。谢谢。

强文本

【问题讨论】:

  • 你能举个例子吗?我一直在使用 Bio.PDB 解析器,我可以说它对于 PDB 文件是可靠的。尝试测试 r.is_disordered() 以检测无序原子(PDB 中备用位置的原子)或 list(r)。
  • 我对两个残基都尝试了 r.is_disordered(),结果都是'0'。

标签: bioinformatics biopython protein-database


【解决方案1】:

我刚刚查看了提供的 PDB,不同之处在于第一个 VAL (88) 有氢 (H) 的原子坐标,而另一个 VAL (15) 没有。

ATOM   2962  N   VAL B  88      33.193  42.159  23.916  1.00 11.01           N  
ANISOU 2962  N   VAL B  88     1516    955   1712     56   -227   -128       N  
ATOM   2963  CA  VAL B  88      33.755  43.168  24.800  1.00 12.28           C  
ANISOU 2963  CA  VAL B  88     1782   1585   1298    356    -14    286       C  
ATOM   2964  C   VAL B  88      35.255  43.284  24.530  1.00 12.91           C  
ANISOU 2964  C   VAL B  88     1661   1672   1573   -249      0   -435       C  
ATOM   2965  O   VAL B  88      35.961  42.283  24.451  1.00 14.78           O  
ANISOU 2965  O   VAL B  88     1897   1264   2453     30   -293     21       O  
ATOM   2966  CB  VAL B  88      33.524  42.841  26.286  1.00 12.81           C  
ANISOU 2966  CB  VAL B  88     1768   1352   1747    -50   -221   -304       C  
ATOM   2967  CG1 VAL B  88      34.166  43.892  27.160  1.00 16.03           C  
ANISOU 2967  CG1 VAL B  88     2292   1980   1819   -147     73     -8       C  
ATOM   2968  CG2 VAL B  88      32.020  42.727  26.586  1.00 17.67           C  
ANISOU 2968  CG2 VAL B  88     2210   2728   1774   -363   -401     83       C  
ATOM   2969  H   VAL B  88      33.642  41.425  23.899  1.00 13.21           H  
ATOM   2970  HA  VAL B  88      33.340  44.035  24.608  1.00 14.73           H  
ATOM   2971  HB  VAL B  88      33.941  41.979  26.492  1.00 15.37           H  
ATOM   2972 HG11 VAL B  88      34.011  43.670  28.081  1.00 19.23           H  
ATOM   2973 HG12 VAL B  88      35.110  43.912  26.983  1.00 19.23           H  
ATOM   2974 HG13 VAL B  88      33.777  44.746  26.959  1.00 19.23           H  
ATOM   2975 HG21 VAL B  88      31.902  42.523  27.516  1.00 21.20           H  
ATOM   2976 HG22 VAL B  88      31.596  43.562  26.377  1.00 21.20           H  
ATOM   2977 HG23 VAL B  88      31.647  42.026  26.047  1.00 21.20           H

我会为分析中的每个残基过滤掉这些原子。那么你应该几乎总是得到相同数量的原子。正如有人提到的,您必须考虑的另一件事是 Biopython 所说的“无序残基”。这些残基对于晶格中的原子有多个替代位置(他们称之为“altloc”)。解决这个问题应该可以解决您的问题。 如果您在过滤这些原子方面需要帮助,请告诉我。 法比奥

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-11-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-01-08
    • 1970-01-01
    • 1970-01-01
    • 2011-10-03
    相关资源
    最近更新 更多