【发布时间】:2019-04-02 11:51:12
【问题描述】:
我有以下示例数据框:
Date count_row Work_Type
2018-07-31 00:00:00 1 logpage
2018-08-01 00:00:00 1 logpage
2018-08-01 00:00:00 1 logpage
2018-08-01 00:00:00 1 logpage
2018-08-01 00:00:00 1 logpage
2018-09-02 00:00:00 1 logpage
2018-09-02 00:00:00 1 logpage
2018-09-03 00:00:00 1 logpage
2018-09-04 00:00:00 1 logpage
2018-09-04 00:00:00 1 logpage
2018-09-06 00:00:00 1 logpage
2018-09-07 00:00:00 1 logpage
2018-09-08 00:00:00 1 logpage
我想将其分解为几周并计算该周出现的次数。具体来说,我认为一周的开始是星期一,一周的结束是星期日。
例如,2018 年 9 月 3 日是星期一(或者我认为是一周的开始)。所以从那个星期一到下个星期天的任何事情我都算作 2018 年 9 月 3 日。
下面是我正在寻找的数据框结果:
Beginning of Week Date (Mon) count
7/30/2018 5
8/27/2018 2
9/3/2018 6
我尝试了以下代码:
df.set_index('Date', inplace=True)
df.sort_index(inplace=True)
def take_first(array_like):
return array_like[0]
output = df.resample('W',
how={'Date': take_first,
'count_row': 'sum'},
loffset=pd.offsets.timedelta(days=-6))
这是我得到的错误:
IndexError: index out of bounds
【问题讨论】:
标签: python pandas datetime count