【发布时间】:2019-01-15 19:47:28
【问题描述】:
这是我的第一篇文章,如有错误请见谅。
我有两个要按样本名称合并的数据集,问题是第二个数据集在样本名称中有额外的标签,并且与第一个数据集的顺序不同。
Clinical
Patient, Cell Count
BB-01-D1 7
BB-02-D1 4
BB-04-D30 2
Flow
Patient, Cell Count
2-5-19_BB-01-D1 7
3-15-19_BB-04-D30 2
2-6-19_BB-02-D1 4
我想知道如果“患者”列包含部分相同的名称,是否有一种方法可以组合和匹配,或者是否有一种方法可以消除患者列中所有行中的额外标签所以我可以简单地重新排序。
提前谢谢你。
【问题讨论】:
-
请尝试分享一个最小的、可重复的示例,说明您到目前为止所尝试的内容
-
看看
stringr或者用基本函数做一些正则表达式。