【发布时间】:2020-03-18 14:15:38
【问题描述】:
我有一个非常大的数据框,其中包含多年的销售数据和数万个 skew_id(即):
date skew_id units_sold
0 2001-01-01 123 1
1 2001-01-02 123 2
2 2001-01-03 123 3
3 2001-01-01 456 4
4 2001-01-02 456 5
...
我有另一个将 skew_ids 映射到 skew_price(即)的数据框:
skew_id skew_price
0 123 100.00
1 456 10.00
...
我的第一个数据帧太大了,我无法在不达到内存限制的情况下合并。
我想计算每日收入(即):
date revenue
0 2001-01-01 140
1 2001-01-02 250
2 2001-01-03 300
...
【问题讨论】:
-
我建议你将大的
df分割成更小的部分,然后将它们一个一个地合并(当然是在一个循环中)。 -
预期输出是什么?
-
已编辑以包含预期输出