【发布时间】:2018-04-06 10:01:32
【问题描述】:
我有一个包含两列的 DataFrame
userID duration
0 DSm7ysk 03:08:49
1 no51CdJ 00:35:50
2 ...
'duration' 类型为 timedelta。我试过使用
bins = [dt.timedelta(minutes = 0), dt.timedelta(minutes =
5),dt.timedelta(minutes = 10),dt.timedelta(minutes =
20),dt.timedelta(minutes = 30), dt.timedelta(hours = 4)]
labels = ['0-5min','5-10min','10-20min','20-30min','30min+']
df['bins'] = pd.cut(df['duration'], bins, labels = labels)
但是,分箱数据不使用指定的分箱,而是为帧中的每个持续时间创建的。
将 timedelta 对象分箱到不规则箱中的最简单方法是什么?还是我只是在这里遗漏了一些明显的东西?
【问题讨论】:
标签: python pandas datetime timedelta binning