【发布时间】:2014-09-10 11:57:23
【问题描述】:
我在列表中有这样的序列"MSGSRRKATPASRTRVGNYEMGRTLGEGSFAKVKYAKNTVTGDQAAIKILDREKVFRHKMVEQLKREISTMKLIKHPNVVEIIEVMASKTKIYIVLELVNGGELFDKIAQQGRLKEDEARRYFQQLINAVDYCHSRGVYHRDLKPENLILDANGVLKVSDFGLSAFSRQVREDGLLHTACGTPNYVAPEVLSDKGYDGAAADVWSCGVILFVLMAGYLPFDEPNLMTLYKRICKAEFSCPPWFSQGAKRVIKRILEPNPITRISIAELLEDEWFKKGYKPPSFDQDDEDITIDDVDAAFSNSKECLVTEKKEKPVSMNAFELISSSSEFSLENLFEKQAQLVKKETRFTSQRSASEIMSKMEETAKPLGFNVRKDNYKIKMKGDKSGRKGQLSVATEVFEVAPSLHVVELRKTGGDTLEFHKVCDSFYKNFSSGLKDVVWNTDAAAEEQKQ"
我想创建一个子字符串,就像出现“K”的地方一样,它需要在“K”之前拉出 6 个字符,在“K”之后拉出 6 个字符
例如:MSGSRRKATPASR,这里是 -6..K..+6
对于整个序列..我尝试了 R 中的子字符串函数,但我们需要指定开始和结束位置。这里位置未知
谢谢
【问题讨论】:
-
如果两个
K相隔 6 个字母,就像在LEDEWFKKGYKPP中一样,会发生什么? -
相关帖子Biostars
标签: regex r substring bioinformatics