【问题标题】:Data analyzing in R with nycfights13 package使用 nycfights13 包在 R 中进行数据分析
【发布时间】:2019-01-30 20:15:47
【问题描述】:

我正在尝试找出哪些目的地的航班延误率最高。例如,洛杉矶国际机场有 10 个航班,其中 3 个航班延误,洛杉矶国际机场的延误率为 30%。这是我到目前为止所拥有的,我只是无法正确计算公式。

flights %>% 
  group_by(dest) %>% 
  summarise(delay_rate = n_distinct(flight) / n_distinct(dep_delay)) %>% 
  arrange(desc(delay_rate)) %>% 
  view()

【问题讨论】:

  • 请提供所需的输出。
  • @Alexandregeorges 所需的输出应该是一个包含每个目的地延迟率的列表。

标签: r database data-extraction


【解决方案1】:
flights %>% 
  group_by(dest) %>% 
  summarise(delay_rate = n_distinct(dep_delay > 0) / n() * 100) %>% 
  arrange(desc(delay_rate)) %>% 
  View()

其中n_distinct(dep_delay > 0) 是延误的航班数量 n() 是总航班数

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-12-31
    • 1970-01-01
    • 2011-05-14
    • 2019-06-12
    • 1970-01-01
    • 1970-01-01
    • 2015-03-10
    • 2016-10-23
    相关资源
    最近更新 更多