1
对于R和机器学习来说非常新颖,但是我不得不基于许多变量e.e进行预测客户流失的项目。服务时间长度,发出的信用票据数量,错过交付的数量,价格上涨的数量等。R对于预测和倾向的预测模型原因%
我使用rpart和randomforest,并获得了每个客户端的流失预测数据集。我能够产生一个信心矩阵,看看哪些是重要的指标。但是,输出的目的是作为“风险”客户名单发送给销售团队处理。
对此,真正重要的是追加信心/倾向/可能性来搅动,这样我可以按照风险排序,但是有没有办法为每个客户添加一个类别/汇总/原因至于为什么他们被预测会流失 - 即客户abc - 价格上涨的高分,所以我们需要小心定价。客户对错过交付的拒绝率高 - 需要修复我们的服务?
非常感谢您的帮助。
谢谢你的理解。然而,第2点听起来非常手动 - 如果我有10万客户,我是否需要为每个客户跟踪树下的变量?没有办法确定每个客户的根?谢谢 – user3103335