【发布时间】:2018-11-11 04:12:54
【问题描述】:
我有一个数据集 (DATE_LOCATION, Sold),其中包含在不同日期销售的产品。日期为 9 个月,从一个月开始随机 13 天或更长时间。我必须以这样一种方式分离数据,对于产品,有多少产品连续售出 1-3 天,连续售出 4-7 天,连续售出 8-15 天,连续售出> 16 天。那么如何使用 pandas 和其他包在 python 中编写代码
DATE_LOCATION Sold
07-08-16 0:00 2
08-08-16 0:00 7
12-08-16 0:00 3
13-08-16 0:00 1
14-08-16 0:00 2
15-08-16 0.00 1
.
.
.
22-10-16 0:00 1
23-10-16 0:00 2
26-10-16 0:00 1
28-10-16 0:00 1
29-10-16 0:00 3
30-10-16 0:00 3
.
.
.(goes for 9 months of data)
.
我什至不知道如何在 python 中为此编写代码 需要的输出是
Days Sold
1-3 20 #(7,8),(22,23),(26),(28,29,30) dates because the range is [1,3]
4-7 7 #(12,13,14,15) dates because the range is [4,7]
8-15 0
>16 0
如果至少有人发布了一个从哪里开始的链接,我会很高兴。 我试过了
df["DATE_LOCATION"] = pd.to_datetime(df.DATE_LOCATION)
df["DAY"] = df.DATE_LOCATION.dt.day
def flag(x):
if 1<=x<=3:
return '1-3'
elif 4<=x<=7:
return '4-7'
elif 8<=x<=15:
return '8-15'
else:
return '>=16'
df["Days"] = df.DAY.apply(flag)
df["Days"].Sold.sum()
这给了我每个月这些天之间售出的产品数量。但我需要指定范围内的产品总和,其中产品在指定的连续销售中。
【问题讨论】:
-
这给了我每月 1-3,4-7,8-15,>16 天之间销售的产品数量。我需要连续 1-3 天、4-7 天的天数范围内销售的产品数量...
-
我不需要两天之间销售的产品数量示例如果产品连续销售 2 天,我需要将其放置在 1-3 范围内,如果产品售价为接下来的 30 天,我需要将其放置在 >16 范围内。不取决于今天是什么日子
标签: python python-3.x pandas datetime