【发布时间】:2020-05-23 04:51:42
【问题描述】:
我目前正在处理一个包含始发地、目的地和其他一些空中交通相关信息的空中交通数据集。但是,就我的分析而言,只要航班在相同的两个城市之间进行,我就想合并信息。
例如,西雅图到波特兰的航班数据需要与波特兰到西雅图的航班数据合并。
这是数据集的一个示例:
airtravel <- structure(list(CARRIER = structure(c(6L, 13L, 6L, 1L, 1L, 13L,
17L, 17L, 13L, 13L, 13L, 13L, 2L, 1L, 13L), .Label = c("9E",
"AA", "AS", "B6", "DL", "EV", "F9", "G4", "HA", "MQ", "NK", "OH",
"OO", "UA", "WN", "YV", "YX"), class = "factor"), OD = c("DCA - ORD",
"PDX - SEA", "ORD - DCA", "CHA - ATL", "ATL - CHA", "ELM - DTW",
"LGA - RIC", "RIC - LGA", "DTW - ELM", "BZN - SEA", "SEA - BZN",
"SEA - PDX", "DCA - LGA", "AVL - ATL", "SFO - SNA"), diff = c(164, 158, 146,
142, 141, 138, 138, 138, 136, 130, 130, 130, 127, 124, 124
)), row.names = c(2983L, 7423L, 3217L, 115L, 17L, 6737L,
11042L, 11315L, 6669L, 6370L, 7624L, 7636L, 685L, 66L, 7693L), class = "data.frame")
我想总结一下涉及相同两个城市的行的差异。有人可以阐明如何解决这个问题吗?
提前致谢!
【问题讨论】:
-
聚合是什么意思?你想对这些行之间的值求和还是做其他事情?通常最好使用
dput共享数据并显示预期输出。请阅读有关how to ask a good question 以及如何提供reproducible example 的信息。 -
@RonakShah,非常感谢您的建议。我已经相应地编辑了我的问题。我仍然是堆栈溢出的新手,非常感谢您的 cmets!
标签: r data-cleaning