项目:预测商业决策带来的收益增长
项目概述:
业务问题:你最近加入了一家制造和出售高端家居商品的公司。去年,公司向客户寄送了第一批产品目录册(catalog),今年准备在接下来的几个月内再向外寄送一批产品目录册。公司今年的邮寄名单中新增了 250 名客户,他们希望向这 250 个客户寄送产品目录册。
你的经理请你计算下通过向这些客户寄送产品目录册公司预期盈利多少。作为业务分析师,你需要帮助经理得出这些数据。经理虽然对数据分析有所了解,但是不太熟悉预测模型。
经理请你预测这 250 个新客户预期会带来的利润。如果这些新客户带来的预期利润超过一万美元,那么管理层就会向他们寄送产品目录册。
详细信息:
印刷和寄送每本产品目录册的成本是 6.5 美元。
通过产品目录册出售的所有产品的平均毛利率(价格减去成本)是 50%。
在计算利润时,确保先将收入乘以毛利率,然后再减去 6.5 美元的成本。
写一个简短的建议报告,向经理阐明为何公司要采纳你的建议
业务分析报告:
第 1 步:理解业务和数据
关键决策:
- 需要作出什么样的决策?
需要作出决策是否要向这250名客户寄送产品目录册。 - 作出这些决策需要获取哪些数据?
第 2 步:分析、建模和验证
问题1:首先,我选取了Customer Segment、Customer ID、ZIP、Store Number、Responded to Last Catalog、Avg Num Products Purchased、# Years as Customer这几个变量,分别探索它们与Avg Sale Amount之间是否存在显著得线性关系,结果如下:
(1)
从该图中能看出趋势线平缓,R² = 0.0015远小于0.3,所以Customer ID和Avg Sale Amount之间的线性关系差。
(2)
从该图中能看出趋势线平缓,R² = 6E-05远小于0.3,所以ZIP和Avg Sale Amount之间的线性关系差。
(3)
从该图中能看出趋势线平缓,R² = 6E-05远小于0.3,所以Store Number和Avg Sale Amount之间的线性关系差。
(4)
从该图中能看出趋势线呈上升趋势,R² = 0.7323大于0.7,所以Avg Num Products Purchased和Avg Sale Amount之间的线性关系显著。
(5)
从该图中能看出趋势线平缓,R² = 0.0009远小于0.3,所以# Years as Customer和Avg Sale Amount之间的线性关系差。
(6)
从该图中能看出趋势线平缓,R² = 0.0397,所以# Years as Customer和Avg Sale Amount之间的线性关系并不显著。
(7)
从该表能看出调整决定系数为0.70199大于0.7,且各系数的P值都接近于0,因此Customer Segment
和Avg Sale Amount存在显著得线性关系。
结合以上分析,我选取Avg Num Products Purchased和Customer Segment作为模型的预测变量
问题2:
从上表可以看出,我所构建的多元线性模型的调整决定参数为0.836602大于0.7,且各预测变量系数的P值都接近于0,所以每个变量都与我所构建的模型有很好的拟合。
问题3:最佳线性回归方程为
Y = 58.05 + 66.98 * Avg Num Products Purchased + 245.42 * (If Type:Credit Card Only) + 527.26 * (If Type:Loyalty Club and Credit Card)+96.06* (If Type:Loyalty Club Only)+0*(If Type: Store Mailing List)
第 3 步:演示/可视化:
问题1:我的建议是公司应该向这250个客户发送宣传册。
问题2:通过建立好的多元线性回归模型,我对这250个客户的销售额进行了预测,预测出销售额后有对预期毛利以及减去宣传册制作成本的预期利润进行了计算,发现最终得出的预期总利润大于10000美元,满足公司的目标,因此建议应该向这250个客户发送宣传册。
问题3:新的宣传册带来的利润预计是21987.43美元。