【发布时间】:2017-11-26 03:38:01
【问题描述】:
我有两个数据框:
df1 = row1;row2;row3
df2 = row4;row5;row6;row2
我希望我的输出数据框只包含 df1 中唯一的行,即:
df_out = row1;row3
我怎样才能最有效地做到这一点?
这段代码做了我想要的,但是使用了 2 个 for 循环:
a = pd.DataFrame({0:[1,2,3],1:[10,20,30]})
b = pd.DataFrame({0:[0,1,2,3],1:[0,1,20,3]})
match_ident = []
for i in range(0,len(a)):
found=False
for j in range(0,len(b)):
if a[0][i]==b[0][j]:
if a[1][i]==b[1][j]:
found=True
match_ident.append(not(found))
a = a[match_ident]
【问题讨论】:
-
不是重复的,因为我没有映射到两个数据帧中的公共值的唯一 ID。