【发布时间】:2020-06-05 15:56:37
【问题描述】:
所以我有这两个数据框
df1
title URL number date
a /url-1 1 21-02-2020
a /url-1 10 20-02-2020
a /url-1 17 19-02-2020
b /url-2 100 21-02-2020
b /url-2 106 20-02-2020
df2
URL number date
/url-1 5 21-02-2020
/url-1 12 20-02-2020
/url-1 50 19-02-2020
/url-3 9 21-02-2020
/url-3 11 20-02-2020
所以我需要执行这些操作以将它们组合成 1 个数据框:
1) 外部连接(如果我错了,请纠正我)df1 和 df2 但我不知道如何在 4 列中显示结果,因为我需要按“URL”和“日期”列分组(将是如下图所示)。
2) 聚合 df1["number"] 和 df2["number"] 并将它们相加
这是我想要的结果:
new_df
title URL number date
a /url-1 6 21-02-2020
a /url-1 22 20-02-2020
a /url-1 67 19-02-2020
b /url-2 100 21-02-2020
b /url-2 106 20-02-2020
null /url-3 9 21-02-2020
null /url-3 11 20-02-2020
非常感谢您的帮助! :)
【问题讨论】:
-
为什么 url-3 的数字是 5 和 22,而不是分别是 9 和 11?
-
您好,我已经更新了数字。刚才打错了:)
标签: python-3.x pandas pandas-groupby outer-join