【发布时间】:2014-11-13 02:03:21
【问题描述】:
我想在另一个具有 500 多行的 data.frame [Database] 中查找单个字符串 [Sequences]。
例如:
Sequences<-c("AzzY","BbDe")
Database<-c("TTUAzzY","aaa","DBbDe","CAzzY")
理想情况下,代码将遍历 [Database] 的每一行以查找是否与 [Sequences] 之一匹配。在上面的示例中,“AzzY”将有 2 个匹配项,“BbDe”将有 1 个匹配项。我希望将此计数添加到 [Sequences] 的新列中。
非常感谢。
【问题讨论】:
-
你试过什么?您的示例数据设置不正确。它们是向量吗?数据框?列表?
-
@RichardScriven 我已经尝试过
grep(pattern = "AzzY", x = Database, value = TRUE),但这只是在控制台中打印每个匹配项的输出。我还需要手动添加每个序列,而不是让代码遍历数据库。它们是 data.frame 中的因素 -
你应该查看 Biostrings 包。
-
@RichardScriven 数据库是我希望找出单个字符串在序列中出现的次数的data.frame。
-
Map(grep, Sequences, Database)怎么样
标签: r