【发布时间】:2018-12-24 07:14:00
【问题描述】:
我有以下dataframeyy
fundId Year Qtr StockCurrentQtr StockNextQtr
1 2015 1 1,2,3,4,5 2,3,4,51
1 2015 2 2,3,4,51 7,8,9,4,2
1 2015 3 7,8,9,4,2 NA
2 2015 1 10,11,14 14,16,19
2 2015 2 14,16,19 20,21,45
2 2015 3 20,21,45 NA
我想知道StockNextQtr 和StocCurrentQtr 每行group_by fundId 之间的区别或者'StockCurrentQtr' 列的连续行之间的区别group_byfundId
yy <- yy %>%
group_by(fundId) %>%
mutate(StockDiff = apply(yy,2,function(x){
paste(setdiff(unlist(strsplit(x[5], split = ",")), unlist(strsplit(x[4],
split = ","))),collapse = ",")}))
我收到以下错误:
StockDiff 列的长度必须为 3(组大小)或 1,而不是 5
【问题讨论】:
-
你能用你的预期输出更新你的帖子吗?
-
不要像这样以非标准化的 CSV 格式存储您的数据。它通常会给您带来麻烦。
标签: dataframe r dataframe dplyr tidyverse