【发布时间】:2016-09-09 12:42:58
【问题描述】:
我已经寻找类似的主题,但找不到解决方案。
我已按运营商对以下数据集进行了分组,并创建了新变量以成功查看平均和总延迟时间。现在我只想按平均延迟来排列数据,但是当我将下面的代码放入其中时,它会为每一行返回相同的数据。谁能帮我弄清楚我哪里出错了?
使用 dplyr 包,数据集是“航班”,过滤掉了 na 值使用:
filter(!is.na(dep_delay), !is.na(arr_delay)).
我从这个资源http://r4ds.had.co.nz/transform.html#exercises-11的第 5.6.7 节获得了数据和练习
bycarrier %>%
transmute(
arrsum = sum(arr_delay),
arravg = mean(arr_delay),
depsum = sum(dep_delay),
depavg = mean(dep_delay)
) %>%
arrange(desc(arravg))
返回:
Adding missing grouping variables: `carrier`
Source: local data frame [327,346 x 5]
Groups: carrier [16]
carrier arrsum arravg depsum depavg
<chr> <dbl> <dbl> <dbl> <dbl>
1 F9 14928 21.9207 13757 20.20117
2 F9 14928 21.9207 13757 20.20117
3 F9 14928 21.9207 13757 20.20117
4 F9 14928 21.9207 13757 20.20117
5 F9 14928 21.9207 13757 20.20117
6 F9 14928 21.9207 13757 20.20117
7 F9 14928 21.9207 13757 20.20117
8 F9 14928 21.9207 13757 20.20117
9 F9 14928 21.9207 13757 20.20117
10 F9 14928 21.9207 13757 20.20117
# ... with 327,336 more rows
【问题讨论】:
-
检查 order() 或 sort()
-
欢迎来到 StackOverflow。请花时间阅读how to provide a great R example 上的这篇文章以及如何提供minimal, complete, and verifiable example 并相应地修改您的问题。 how to ask a good question 上的这些提示也可能有用。
-
order() 和 sort() 返回以下错误:排序错误 (., arravg) : object 'arravg' not found
标签: r