【发布时间】:2020-04-28 03:56:28
【问题描述】:
我有一些包含起点和终点 (OD) 的 GIS 数据以及有关 OD 当天时间的信息。我打算为此制作一张地图,并根据一天中的时间信息为 OD 着色。
有一点是,有些 OD 在数据集中有白天和黑夜,而且可能有不同的顺序。我想用不同的方式标记它们,例如“白天/黑夜”
有没有简单的方法来做到这一点?我的 MWE 只是一个 OD,但我需要在其他几个中识别它。无论顺序如何,我都可以设法找到重复项,但我不知道如何找出是否有两种时间情况以及如何用“日/夜”替换它们
library(data.table)
Origin<-c("London", "Paris", "Lisbon", "Madrid", "Berlin", "London")
Destination<-c("Paris", "London", "Berlin","Lisbon", "Lisbon", "Paris")
Time=factor(c("Day", "Night", "Day", "Day/Night","Day", "Day/Night"))
dt<-data.table(Origin=Origin, Destination=Destination, Time=Time)
#duplicates regardless of order
dat.sort = t(apply(dt[,.(Origin,Destination)], 1, sort))
dt[duplicated(dat.sort) | duplicated(dat.sort, fromLast=TRUE),]
【问题讨论】:
-
那么您是否试图找出是否存在同一 2 个国家/地区在一天时间有两条记录的情况?
-
我正在尝试查找在白天和晚上运行的同一起点目的地的记录,我想将它们重新编码为“夜间/白天”
标签: r duplicates data.table gis data-cleaning