【发布时间】:2014-08-15 15:42:24
【问题描述】:
我有一个数据框,其中包含时间段 Oct. 2000 到 Dec. 2001(15 个月)的销售额值。我也有与上述相同时间段的利润值,我想在R 中找到这 15 个月的这两个数据框之间的月度相关性。我的数据框sales 是:
Month sales
Oct. 2000 24.1
Nov. 2000 23.3
Dec. 2000 43.9
Jan. 2001 53.8
Feb. 2001 74.9
Mar. 2001 25
Apr. 2001 48.5
May. 2001 18
Jun. 2001 68.1
Jul. 2001 78
Aug. 2001 48.8
Sep. 2001 48.9
Oct. 2001 34.3
Nov. 2001 54.1
Dec. 2001 29.3
我的第二个数据框profit是:
period profit
Oct 2000 14.1
Nov 2000 3.3
Dec 2000 13.9
Jan 2001 23.8
Feb 2001 44.9
Mar 2001 15
Apr 2001 58.5
May 2001 18
Jun 2001 58.1
Jul 2001 38
Aug 2001 28.8
Sep 2001 18.9
Oct 2001 24.3
Nov 2001 24.1
Dec 2001 19.3
现在我知道,在最初的两个月中,我无法获得相关性,因为没有足够的值,但从 Dec 2000 开始,我想通过考虑前几个月的值来计算相关性。因此,对于Dec. 200,我将考虑Oct. 2000、Nov. 2000 和Dec. 2000 的值,这将给我3 个销售值和3 个利润值。同样对于Jan. 2001,我将考虑Oct. 2000、Nov. 2000、Dec. 2000 和Jan. 2001 的值,因此具有4 个销售价值和4 个利润价值。 因此每个月我都会考虑上个月的值来计算相关性,我的输出应该是这样的:
Month Correlation
Oct. 2000 NA or Empty
Nov. 2000 NA or Empty
Dec. 2000 x
Jan. 2001 y
. .
. .
Dec. 2001 a
我知道在R 中有一个函数cor(sales, profit),但我怎样才能找出我的场景的相关性?
【问题讨论】:
-
所以基本上你想循环
cor(sales[1:i], profit[1:i])以增加i? -
@Spacedman 是否会通过考虑前几个月的值来为我提供每年每个月的相关性?很抱歉问了一个不重要的问题,但我是新手,因此没有太多知识。
-
@user2966197 请用清晰的统计术语解释您的问题。您是否可能想要计算互相关(参见
?ccf)? -
@Roland 我想计算每月销售额和利润之间的相关性,例如
Oct 2000Nov. 2000Dec 2001uptillDec 2001。前两个月(Oct 2000&`2000 年 11 月) I cannot get a correlation as there is only 1 or 2 values on each side of sales and profit. But for2000 年 12 月`以后我可以得到相关性,因为我将考虑上个月的值也因此为Dec 2000给出 3 个值。所以每个月我会考虑之前所有月份的值。
标签: r dataframe correlation