【发布时间】:2020-10-31 04:19:43
【问题描述】:
我有一个只是基因列表的数据集:
Genes
Gene1
Gene2
Gene3
Gene4
Gene5
每当提到这些基因中的任何一个时,我都希望找到并从另一个数据集中提取。
我的其他数据集看起来像
Study ID Title Drug ...
1 Study of Gene1 Gene1-drug
2 Study of Gene10 Gene10-drug
3 Study of something Gene4-drug
我希望在我的第二个数据集的任何列中出现任何基因时提取。
我很难找到一个足够相似的问题来重复使用,尽管我知道有很多类似的问题,但我遗漏了一些东西,我发现的大多数示例都有特定的 grep 模式。
到目前为止我一直在尝试:
test = df[apply(df, 1, function(i) any(stringr::str_detect(i, fixed(genelist)))),]
这输出 0 行,但我知道有些行在提到基因的地方有部分匹配。如何修改它以从基因列表数据框中提取和搜索基因?
【问题讨论】: