【发布时间】:2020-01-09 01:13:08
【问题描述】:
按年份计算留存率/流失率
尊敬的社区,我正在从事一个数据挖掘项目,我想将之前的想法从 excel 转变为 R。
我有一个包含合同数据的客户数据库,并且想计算保留率。
我在玩这些library(lubridate); library(reshape2); library(plyr) 但我不知道它在 R 中是如何工作的。
我有这样的数据:
ID Customer START END
1 Tesco 01-01-2000 31-12-2000
2 Apple 05-11-2001 06-02-2002
3 H&M 01-02-2002 08-05-2002
4 Tesco 01-01-2001 31-12-2001
5 Apple 01-01-2003 31-12-2004
我现在正在考虑将数据拆分为年份(df2000、df2001),然后在主表中存在客户名称时再次查找(如果是则返回 1)。
结果可能如下所示:
Customer 2000 2001 2002 2003 Retention Rate
Tesco 1 1 0 0 0.5
Apple 0 1 0 1
H&M 0 0 1 0
【问题讨论】:
标签: r database split retention churn