【发布时间】:2016-04-15 15:20:50
【问题描述】:
我有两个数据集,Transaction_long 和 Transaction_short。 Transaction_long 在数据集中有许多带有购买点(用 true 表示)的政策和价格报价。 Transaction_short 只有购买点的条目。
我的目标是在 Transaction_short 数据集中添加一个名为 Policy_Change_Frequency 的列。对于短数据集中的每个客户,迭代长数据集中该客户的行并计算策略更改的次数。
要查找策略更改,我可以使用 sum(diff(Transaction_Long$policy)!=0),但不确定如何遍历这两个数据集并获得结果
详情:
Customer_Name : name of customer
Customer_ID: Customer Identifier number
Purchase: Boolean variable (Yes-1,No-0)
Policy: Categorical (takes values 1-5)
Price : Price quoted
数据集1-Transaction_Long
Customer_Name,Customer_ID,Purchased,Policy,Price
Joe,101,0,1,500
Joe,101,0,1,505
Joe,101,0,2,510
Joe,101,0,2,504
Joe,101,0,2,507
Joe,101,0,1,505
Joe,101,1,3,501
Mary,103,0,1,675
Mary,103,0,3,650
Mary,103,0,2,620
Mary,103,0,2,624
Mary,103,0,2,630
Mary,103,1,2,627
数据集 2Transaction_Short
Customer_Name , Customer_ID,Purchased,Policy, Price
Joe,101,1,3,501
Mary,103,1,2,627
需要在 Transaction Short Dataset 中添加 Policy Change Frequency 列,所以我最终的 Transcation short Dataset 会是这样的
最终数据集应如下所示
Customer_Name , Customer_ID,Purchased, Policy, Price,Policy_ChangeFreq
Joe,101,1,3,501,3
Mary,103,1,2,627,2
【问题讨论】: