【问题标题】:Python finding the longest ORFPython找到最长的ORF
【发布时间】:2020-04-09 21:55:59
【问题描述】:

谁能告诉我一个简单的解决方案,如何计算 DNA 序列中长度大于 30bp 的最长开放阅读框 (ORF)? ATG 是起始密码子(即 ORF 的开头),TAG、TGA 和 TAA 是终止密码子(即 ORF 的结尾)。不使用 BioPython。

【问题讨论】:

  • 您需要提供更多细节、示例数据和示例代码,您已经尝试过什么,您正在寻找什么结果?

标签: python bioinformatics biopython fasta dna-sequence


【解决方案1】:

这个正则表达式可能可以完成这项工作:

ATG(...){30,}(TAG|TGA|TAA)

(...) 是一个三字母密码子,与 {30,} 匹配 30 次或更多次,并在找到 (TAG|TGA|TAA) 之一时停止。

这个正则表达式可以帮助你找到所有的 ORF,现在你只需要找到最长的,这应该是微不足道的。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-04-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-14
    • 2012-09-14
    相关资源
    最近更新 更多