【发布时间】:2017-05-18 16:51:55
【问题描述】:
我有一个数据框 df:
id name count
1 a 10
2 b 20
3 c 30
4 d 40
5 e 50
这里我有另一个数据框 df2:
id1 price rating
1 100 1.0
2 200 2.0
3 300 3.0
5 500 5.0
我想在列 id 和 id1 上加入这两个数据框(两者都引用相同)。下面是一个df3的例子:
id name count price rating
1 a 10 100 1.0
2 b 20 200 2.0
3 c 30 300 3.0
4 d 40 Nan Nan
5 e 50 500 5.0
我应该使用 df.merge 还是 pd.concat?
【问题讨论】:
-
@piRSquared 先生,这两个答案都是绝对正确的 :) 不能同时选择两个,只有一个问题,假设我正在处理两个数据帧,每个数据帧大约 400 万行。我想要最快的方式,在
join,merge and map之间应该是最优化的方式 -
两者在本质上是相同的。我不在乎你选哪个。 @jezrael 和我总是这样。我们将以一种或另一种方式获得我们的代表。我更感兴趣的是确保这 15 个代表不会浪费。选择他的,因为他比我快几微秒;-)