【发布时间】:2018-10-20 01:52:25
【问题描述】:
在大型坐标数据集的文本中获取本地时区的最快方法是什么?我当前的方法运行良好,但我使用的包“rundel/timezone”(这对于小型集合很简单且非常有用)对于大型集合来说非常慢。
有没有更快的方法来完成下面重现的任务?:
library(data.table)
#REPRODUCE DATA
data <- data.table(latitude=sample(seq(47,52,by=0.001), 1000000, replace = TRUE),
longitude=sample(seq(8,23,by=0.001), 1000000, replace = TRUE))
###get timezone package via rundel/timezone
if (!require("timezone")) devtools::install_github("rundel/timezone")
library(timezone)
###CURRENT SLOW METHOD
system.time(data[,timezone:=find_tz(longitude,latitude),])
user system elapsed
49.017 21.394 74.086
【问题讨论】:
-
我碰巧找到了名为
lutz的包。你检查了吗? -
@jazzurro,不,我没有看到这一点,就我的目的而言,method="fast" 效果很好。感谢您的提示!
-
我认为您想检查一切是否准确。
tz_lookup_coords()可能导致远离人口稠密地区边界附近的时区不准确。 -
之前的评论已删除。
标签: r timezone coordinates geospatial