【发布时间】:2018-04-16 08:32:44
【问题描述】:
我想对客户编号的几个变量求和,然后排除总和为 0 的变量,因为 X1 可以是正数和负数。排除它们后,我想再次“分解”它,这可能吗?
AggData <- aggregate(cbind(X1, X2, X3, X4, X4, X5, X6, X7)~ CustomerNumber +
Date + Accountnumber, mydata, sum)
ClearedData <- AggData[mydata$X1!=0,]
此外,我想创建一个新变量来计算日期并测量重复率,你能帮我吗?
【问题讨论】:
-
如果你想排除总和为零的行,我认为你需要
ClearedData <- AggData[AggData$X1!=0,]。然后您需要使用ClearedData中的类别从mydata中进行选择。 -
您能否提供代码来制作代表您的数据的(虚拟)数据
-
也将其分为两个问题 - 两个部分(聚合/分解和日期计数)是不相关的。
标签: r count aggregate data-cleaning