【发布时间】:2020-02-04 23:10:35
【问题描述】:
大家好,我是 python 新手。我有两个数据框。一个包含药物描述,如下所示:
df1.head(5)
PID Drug_Admin_Description
1 sodium chloride 0.9% SOLN
2 Nimodipine 30 mg oral
3 Livothirine 20 mg oral
4 Livo tab 112
5 Omega-3 Fatty Acids
其他表只有药物名称,如下所示:
df2.head(5)
Drug_Name
Sodium chloride 0.5% SOLN
omega-3 Fatty Acids
gentamicin 40 mg/ml soln
amoxilin 123
abcd 12654
有没有办法只提取 df1 和 df2 中的药物。示例输出如下所示:
new_column
Sodium chloride
omega-3
我尝试在 python 中使用正则表达式,但无法弄清楚我将如何应用它。提前致谢
【问题讨论】:
-
从逻辑上讲,您如何从字符串的其余部分中识别药物名称?
-
是的,你是对的,这将是一个问题。但现在 df1 和 df2 之间常见的任何东西都可以在以后工作,我可以清理数据。谢谢
-
如果你想要通用元素,请看这里:stackoverflow.com/questions/18079563/…