【发布时间】:2018-03-30 18:06:49
【问题描述】:
我希望找到更好的方法来转换这样的“整洁”数据框:
进入如下所示的“超越图”或“超越图”(在水资源应用中通常以两种方式拼写),它只是沿 x 轴对变量进行排名/排序。
这是我现在做的很长的方法:
(样本数据):
library(tidyverse)
timestep <- c("a", "b", "c", "a", "b", "c", "a", "b", "c")
var <- c("x", "x", "x", "y", "y", "y", "z", "z", "z")
taf <- c(18,1,5,23,12,67,7,30,2)
df <- data.frame(timestep, var, taf)
构建一个新的数据框(我认为我需要它?):
df_a <- df %>% filter(var == "x") %>% arrange(desc(taf))
df_b <- df %>% filter(var == "y") %>% arrange(desc(taf))
df_c <- df %>% filter(var == "z") %>% arrange(desc(taf))
df_rank <- rbind(df_a, df_b, df_c)
ts_nums <- length(unique(timestep))
taf_var_rank <- rep(seq(ts_nums),ts_nums)
taf_var_rank_xaxis <- taf_var_rank/(ts_nums+1) #standard calc for xaxis
df_rank <- data.frame(df_rank, taf_var_rank, taf_var_rank_xaxis)
制作这个,df_rank:
对于我这样的情节的最终目标:
ggplot(df_rank, aes(x = taf_var_rank_xaxis, y = taf, color = var)) + geom_line() +
labs(x = "probability of exceedance")
我对 R(和编程)很陌生,我想我可以构建一个通用函数,或者如果我幸运的话,有一个现有的库/函数可以为我压缩这个过程?非常感谢任何帮助,因为我有一些包含许多变量的长时间序列。
干杯,戴夫
【问题讨论】: