【发布时间】:2018-07-20 07:25:46
【问题描述】:
我有一个这样的数据集:
Account_tenure_years = c(982,983,984,985,986,987,988)
N=c(12328,18990,21255,27996,32014,15487,4347)
Y=c(76,64,61,76,94,55,11)
df_table_account_tenure_vs_PPC = data.frame(Account_tenure_years,N,Y)
The dataset looks like this:
Account_tenure_years N Y
982 12328 76
983 18990 64
984 21255 61
985 27996 76
986 32014 94
987 15487 55
988 4347 11
我想做的是这样的:
我想在Account_tenure_years 中的任意两个@ 之间找到correlation,例如982,983 并找到correlation coefficient 与N 和Y columns 即我想找到下面的correlation coefficient表
Account_tenure_years N Y
982 12328 76
983 18990 64
现在我想重复这个 8C2 次,即 28 次。采取不同的行并在每种情况下找到correlation coefficient。
即在下一次迭代中我想要:
Account_tenure_years N Y
983 18990 64
984 21255 61
然后找到它的correlation coefficient。现在,在我收到所有这 28 个correlation coefficients 之后,我将average 拿出来并为整个数据集找到一个mean correlation coefficient。
我如何在 R 中做到这一点?
好吧,如果我找出列之间的相关系数,让我们直截了当
Account_tenure_years column, N
如果我尝试找出列之间的相关系数
Account_tenure_years column, Y
如果我在每种情况下都发现负相关系数,我们能从中推断出什么吗?
【问题讨论】:
-
您需要每一行的
correlation coefficient计数,对吗?我不明白它怎么可能是 28 次? -
@Saurabh Chauhan 让它更简单。假设您先计算 Account_tenure_years 和 N 之间的相关系数,然后计算 Account_tenure_years 和 Y 之间的相关系数,然后找出每种情况下的相关性。如果,假设你在这两种情况下都得到负相关,从统计学上你会推断出什么?或者可以推断出什么?
-
为每个案例计算
correlation coefficient是没有意义的,因为它通常是针对整个数据集计算的。 -
不不,你看这里的主要重点是找到数据集的相关系数,但它是一个 8 $\times$ 3 的数据集,你必须找出第一个和第二个之间的相关性列,然后在第一列和第三列之间。
-
你能检查我的答案吗?我为你做了同样的事情。
标签: r