【发布时间】:2018-09-27 21:33:43
【问题描述】:
如果这已经被覆盖,我提前道歉,我找不到类似的东西。这是我的第一份编程工作(我之前是软件 QA),我一直在为此苦苦挣扎。
我有 2 个数据帧,一个非常大 [df2](1460 万行),我正在逐块迭代它。我试图比较每个数据帧中的同名列,如果它们相等,我想输出较大帧的第二列。
即
if df1['tag'] == df2['tag']:
df1['new column'] = df2['plate']
我尝试了合并,但这并没有输出我预期的结果。
df3 = pd.merge(df1, df2, on='tag', how='left')
我希望我在解释这一点上做得很好。
[编辑:] 我也相信我应该提到 df2 和 df1 都有许多我不想与之交互/更改的附加列。是否可以只比较两个数据帧的单列,并输出第三个附加列?
【问题讨论】:
-
这不是我想要的,但谢谢!
-
你想要只匹配的行,还是所有
df1? -
只有匹配的行。