【发布时间】:2019-03-06 16:59:54
【问题描述】:
我只是想知道是否有解决以下问题的最佳方法:
我有一个相当大的个人公司每日回报数据框。
dates <- c("04.01.1995","05.01.1995","06.01.1995","09.01.1995","10.01.1995","11.01.1995","12.01.1995","13.01.1995")
stock1 <- rnorm(0.1,n = 3)
stock2 <- c(unlist(strsplit(rep("Na",8),split = " ")))
stock3 <- rnorm(0.1,n = 3)
stock4 <- rnorm(0.1,n = 3)
stock5 <- rnorm(0.1,n = 3)
stock6 <- rnorm(0.1,n = 3)
stock7 <- rnorm(0.1,n = 3)
stock8 <- c(unlist(strsplit(rep("Na",8),split = " ")))
cbind(dates,stock1,stock2,stock3,stock4,stock5,stock6,stock7,stock8)
看起来像这样:
dates stock1 stock2 stock3 stock4 stock5....
"04.01.1995" "1.8249" "Na" "2.7125" "0.557280737196038" "1.38681707010098"
我想计算每个特定行的平均值,然后删除同一行中低于“行均值”或阈值的观察值/元素。
提前致谢!
【问题讨论】:
-
您可以使用
mutate计算逐行平均值,然后使用select删除列 -
df.dropna(subset=['stock.2'])
-
很不清楚你在问什么。请举例说明您拥有什么与您想要什么。
-
对不起!上面提供的示例:)
标签: r