【发布时间】:2016-02-03 05:34:42
【问题描述】:
我正在尝试按相应单元格的最短日期对“客户名称”列的条目进行分组。
Client Name Recency
A -10 days
B -4 days
C -1 days
A -5 days
B -2 days
C 0 days
所以最终的结果应该是
A -5
B -2
C 0
当我检查我的“新近度”类型时,我得到:
>> df['recency'].dtype
dtype('<m8[ns]')
我认为这是我的问题,因为我的时间以纳秒为单位?但我觉得这很奇怪,因为它在列中显示天数。
但是当我进行分组时:
>> df.groupby(['Client Name'], sort=False)['recency'].min()
A -73785600000000000
B -345600000000000
C 0
这让我相信我减去的是纳秒而不是天。
为什么数据框的列会变成纳秒?如何返回天的最小值而不是纳秒?
谢谢
【问题讨论】:
标签: python date pandas dataframe