【发布时间】:2017-08-16 06:54:06
【问题描述】:
我的目标是获得以下 R 代码的 pandas 等效项:
df1$String_1_check = ifelse(df1$String_1 == df2[match(df1$String_2, df2$String_2), 1], TRUE, FALSE)
如果 df1 的 String_1 列第 n 行的值等于 df1 的 String_2 列的第 n 行与 df2 的 String_2 匹配的 df2 的第一列,则在新列 String_1_check 中为 True,否则在 String_1_check 中为 False。
df1 在 String_1 和 String_2 中有许多相同值的实例,而 df2 在 String_1 中只有一个可能值的实例。 String_3 不是唯一的。使用这些示例数据框:
df1 = pd.DataFrame({'String_1': ['string 1', 'string 1', 'string 2', 'string 3', 'string 1'], 'String_2': ['string a', 'string a', 'string b', 'string a', 'string c']})
df2 = pd.DataFrame({'String_3': ['string 1', 'string 2', 'string 3'], 'String_2': ['string a', 'string b', 'string c']})
String_1 String_2
0 string 1 string a
1 string 1 string a
2 string 2 string b
3 string 3 string a
4 string 1 string c
String_3 String_2
0 string 1 string a
1 string 2 string b
2 string 3 string c
期望的输出是:
String_1 String_2 String_1_check
0 string 1 string a True
1 string 1 string a True
2 string 2 string b True
3 string 3 string a False
4 string 1 string c False
我尝试了np.where、isin、pd.match(现已弃用),但没有找到解决方案。
【问题讨论】:
标签: python pandas if-statement match