【发布时间】:2018-03-14 15:21:39
【问题描述】:
我有带有客户发票之间时间戳的交易数据。我正在尝试计算两个唯一发票之间的平均天数(通过“ServicedOn”)。这些注意事项有两个:
- 一张独特的发票可以有多个带有不同时间戳的行(因为它们可能在不同的时间提供服务)。
- 时间戳也有时间值,所以我无法使用 diff() 方法来计算增量天数。
数据框如下所示:
InvoiceNo SoldOn ServicedOn ItemType ItemCode GuestId FinalSalePrice FirstVisit Package BUName SalePrice Merchant_id
21312 4/26/2015 12:55:12 PM 4/26/2015 8:00:00 AM 0 SER-310-008 5a531810-9413-4091-acd5-424d125b0c9e 3089.9 No No Package Spa 2500 POW
31639 1153 6/12/2015 7:11:22 PM 6/12/2015 6:15:00 PM 0 SER-1257-008 5a531810-9413-4091-acd5-424d125b0c9e 5700.0 No No Package Spa 5000 POW
42492 73 5/15/2015 8:05:50 PM 5/15/2015 8:05:50 PM 2 ITM-3407-001 5a531810-9413-4091-acd5-424d125b0c9e 1600.0 No No Package Default 1422 POW
42493 73 5/15/2015 8:06:08 PM 5/15/2015 8:06:08 PM 2 ITM-3175-001 5a531810-9413-4091-acd5-424d125b0c9e 2750.0 No No Package Default 2444 POW
42494 73 5/15/2015 8:05:38 PM 5/15/2015 8:05:38 PM 2 ITM-4340-001 5a531810-9413-4091-acd5-424d125b0c9e 575.0 No No Package Default 511 POW
我不确定如何继续,所以任何指导都会受到赞赏!
【问题讨论】:
-
为了澄清您的要求,请提供您认为结果应该考虑您的样本数据的内容。
-
理想情况下,对于每张唯一发票,我会查看第一个 ServicedOn 时间戳并计算距离下一个 invoiceno. 的第一个 ServicedOn 时间戳的天数。
-
例如:发票号。 21312 我会查看第一个 servicedOn(4/26/2015) 并计算直到发票号的天数。 31639 的第一次服务(2015 年 6 月 12 日)。
标签: python pandas datetime data-science