【发布时间】:2019-10-28 00:16:01
【问题描述】:
我有一个数据框df:
ID Final_score appScore pred_conf pred_chall obs1_conf obs1_chall obs2_conf obs2_chall exp1_conf exp1_chall
3079341 4 low 6 1 4 3 4 4 6 2
3108080 8 high 6 1 6 1 6 1 6 2
3130832 9 high 2 6 3 4 5 4 6 2
3148118 10 high 4 4 4 4 5 4 6 2
3148914 10 high 2 2 2 5 2 5 6 2
3149040 2 low 5 4 6 4 6 4 6 4
Q1:我想为 _conf 和 _chall 功能的 appScore high 和 low 创建两个叠加图。我想让这些图表有不同的颜色。我怎样才能做到这一点?
Q2:是否可以绘制两张平滑图,一张用于所有_conf 变量/特征,一张用于所有_chall 特征。
请注意,我的列没有时间变量,而是按以下顺序排列:
pred_conf --> obs1_conf --> obs2_conf --> exp1_conf
pred_chall --> obs1_chall --> obs2_chall --> exp1_chall
这只是一个玩具示例,实际数据有几行多列。作为参考,我在下面分享 dput():
dput(df)
structure(list(ID = c(3079341L, 3108080L, 3130832L, 3148118L, 3148914L, 3149040L),
Final_score = c(4L, 8L, 9L, 10L, 10L, 2L),
appScore = structure(c(2L, 1L, 1L, 1L, 1L, 2L), .Label = c("high", "low"), class = "factor"),
pred_conf = c(6L, 6L, 2L, 4L, 2L, 5L),
pred_chall = c(1L, 1L, 6L, 4L, 2L, 4L),
obs1_conf = c(4L, 6L, 3L, 4L, 2L, 6L),
obs1_chall = c(3L, 1L, 4L, 4L, 5L, 4L),
obs2_conf = c(4L, 6L, 5L, 5L, 2L, 6L),
obs2_chall = c(4L, 1L, 4L, 4L, 5L, 4L),
exp1_conf = c(6L, 6L, 6L, 6L, 6L, 6L),
exp1_chall = c(2L, 2L, 2L, 2L, 2L, 4L)),
class = "data.frame", row.names = c(NA, -6L))
以下帖子很有帮助,但它们考虑了时间变量。我应该如何使用某种时间变量来更改我的任务名称?
Plotting multiple time-series in ggplot
Multiple time series in one plot
更新 1:
当为high 和low appScore 组中的_conf 绘制时,我的图表目前看起来像这样。我想对这些图表进行平滑和叠加,看看是否有任何差异或模式。
这是我用过的代码
library(ggplot2)
df_long %>%
filter(part == "conf") %>%
ggplot(aes(feature, val, group = appScore)) +
geom_line() +
geom_point() +
facet_wrap(~appScore, ncol = 1) +
ggtitle("conf")
更新 2:
使用脚本:
test_long %>%
ggplot(aes(feature, val, color = appScore, group = appScore)) + #, size = Final_score)) +
geom_smooth() +
facet_wrap(~part, nrow = 1) +
ggtitle("conf and chall")
我已经能够生成所需的图表:
【问题讨论】:
-
在您的案例中时间变量的作用是什么? “我的列没有时间变量,而是按顺序排列的”-据我所知,〜时间〜是功能名称的第一部分(obs1在pred之后,obs2在obs1之后,依此类推)。但是在这个代码块
autoplot(ts(df$pred_conf))中,ID是时间变量。 -
@laroslav 您的理解是正确的,它与您在代码中的编写方式一致。 pred 然后 obs1 然后 obs2 然后 exp1。我分享的代码块只是为了展示我的尝试。
标签: r plot time-series smoothing