【发布时间】:2012-12-10 05:00:26
【问题描述】:
我有一个按帐户 ID 划分的销售时间序列。为了计算平均增长,我需要为每个 ID 提取非零销售额的第一个月。由于帐户可能是在不同时间建立的,因此我需要动态识别帐户中销售额首次> 0 的时间。
该行的索引足以让我传递给计算增长的函数。因此,我希望通过帐户 ID 得到以下结果:
54 - [1]
87 - [4]
95 - [2]
I tried `apply(df$Sales,2,match,x>0)` but this doesn't work.
有什么建议吗?或者,有没有更简单的方法来使用这个数据集计算 CAGR?
提前致谢!
CalendarMonth ID Sales
8/1/2008 54 6692.60274
9/1/2008 54 6476.712329
10/1/2008 54 6692.60274
11/1/2008 54 6476.712329
12/1/2008 54 11098.60822
7/1/2008 87 0
8/1/2008 87 0
9/1/2008 87 0
10/1/2008 87 18617.94155
11/1/2008 87 18017.36279
12/1/2008 87 18617.94155
1/1/2009 87 18617.94155
2/1/2009 87 16816.20527
7/1/2008 95 0
8/1/2008 95 8015.956284
9/1/2008 95 0
10/1/2008 95 8015.956284
11/1/2008 95 6309.447514
12/1/2008 95 6519.762431
1/1/2009 95 6519.762431
【问题讨论】:
-
您是说要在销售额非零的 ID 条目子集中对该行的索引吗?因为 87 的 4 仅当您将此表子集时,否则它将是 9(从顶部计数)。
-
是的,没错。我还没有完全弄清楚如何,但使用 plyr 和 ggplot,我有研究 ID 子集的愿景,以有效地计算和显示平均增长统计数据。
标签: r