【发布时间】:2017-01-29 09:26:06
【问题描述】:
对 R 和机器学习非常陌生,但是我必须开展一个项目来根据许多变量预测客户流失,例如服务期限、发行信用票据的数量、错过交货的数量、价格上涨的数量等。
我正在使用 rpart 和 randomforest,并且得到了一个数据集,每个数据集都有一个流失预测。我能够生成置信度矩阵并查看哪些是重要指标。但是,输出的目的是将要处理的“有风险”客户列表发送给销售团队。
对此真正重要的是,将信心/倾向/可能性百分比附加到流失率,以便我可以按风险顺序进行排名,而且,有没有办法为每个客户附加一个类别/摘要/原因作为为什么他们被预测会流失 - 即客户 abc - 价格上涨的高分,所以我们需要谨慎定价。客户定义 - 错过交货率很高 - 需要修复我们的服务吗?
非常感谢您的帮助。
【问题讨论】:
标签: r machine-learning random-forest prediction rpart