【发布时间】:2020-07-03 13:35:57
【问题描述】:
假设我有一个如下所示的数据框(实际数据框有数百万个观察值)。我正在尝试通过 signal_up 列的各种值来查找信号列和其他净返回列组之间的相关性。
我已经尝试过“dplyr”库以及“group_by”和“summarize”函数的组合。但是,我只能获得两列而不是多列之间的相关性。
library(dplyr)
df %>%
group_by(Signal_Up) %>%
summarize (COR=cor(signal, Net_return_at_t_plus1))
下面给出了数据和期望的结果。
数据
期望的结果
“信号”与 [“Net_return_at_t_plus1”、“Net_return_at_t_plus5”、“Net_return_at_t_plus10”] 之间的相关性]
按“Signal_Up”分组
【问题讨论】:
标签: r dataframe statistics correlation