【问题标题】:Extracting values from matchPattern从 matchPattern 中提取值
【发布时间】:2023-03-28 08:25:02
【问题描述】:

我正在使用Biostrings 包中的matchPattern 函数来查找基因组中的特定序列。一旦找到,我想显示匹配实例之间间距的频率分布。

示例:运行以下代码

Match1 <- matchPattern(ResEnz, genome$chr1)
Match1

会返回这个:

Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
            start       end width
    [1]     27974     27979     6 [GAATTC]
    [2]     29889     29894     6 [GAATTC]
    [3]     32212     32217     6 [GAATTC]
    [4]     36941     36946     6 [GAATTC]
    [5]     49920     49925     6 [GAATTC]
    ...       ...       ...   ... ...
[67137] 248927762 248927767     6 [GAATTC]
[67138] 248928956 248928961     6 [GAATTC]
[67139] 248929077 248929082     6 [GAATTC]
[67140] 248932486 248932491     6 [GAATTC]
[67141] 248941974 248941979     6 [GAATTC]

现在,我想使用这些数据形成一个向量,该向量将具有一个条目的端点和后续条目的起点之间的差异。 (忽略第一个起点和最后一个终点)

即,对于 Match1

1910, 2318, 4724, 12974 .... 9483 

生成的 Match1 对象属于 XStringViews 类,名称函数返回 NA,我目前对如何处理这件事感到困惑。请帮忙。

【问题讨论】:

    标签: r bioconductor genetics


    【解决方案1】:

    经过进一步调查,我发现函数 start(Match1)end(Match1) 将产生包含感兴趣值的向量。我会把这个留在这里,以防其他人遇到同样的问题。

    【讨论】:

      猜你喜欢
      • 2016-10-25
      • 1970-01-01
      • 1970-01-01
      • 2013-02-15
      • 2018-10-11
      • 2020-02-08
      • 2018-07-25
      • 2012-04-28
      • 2021-10-07
      相关资源
      最近更新 更多