【发布时间】:2012-10-20 20:17:51
【问题描述】:
我在将 POSIXct 转换为字符并返回到 R 中的 POSIXct 时遇到问题。我运行以下代码:
time_seq_01 <- seq(as.POSIXct("2012-10-28 02:00:00"), by = 900, length.out = 10)
time_seq_02 <- as.character(time_seq_01)
time_seq_03 <- as.POSIXct(time_seq_02)
或同等的:
time_seq_01 <- seq(as.POSIXct("2012-10-28 02:00:00"), by = 900, length.out = 10)
time_seq_02 <- format(time_seq_01,usetz = TRUE)
time_seq_03 <- as.POSIXct(time_seq_02)
这是 2012 年夏令时从 中欧夏令时 (CEST) 到 中欧夏令时 (CET) 的时间戳(10 月 2 日的最后一个星期日:00 - 03:00)。
当我调用这些元素时,我得到了
time_seq_01
[1] "2012-10-28 02:00:00 CEST" "2012-10-28 02:15:00 CEST"
[3] "2012-10-28 02:30:00 CEST" "2012-10-28 02:45:00 CEST"
[5] "2012-10-28 02:00:00 CET" "2012-10-28 02:15:00 CET"
[7] "2012-10-28 02:30:00 CET" "2012-10-28 02:45:00 CET"
[9] "2012-10-28 03:00:00 CET" "2012-10-28 03:15:00 CET"
time_seq_02
[1] "2012-10-28 02:00:00 CEST" "2012-10-28 02:15:00 CEST"
[3] "2012-10-28 02:30:00 CEST" "2012-10-28 02:45:00 CEST"
[5] "2012-10-28 02:00:00 CET" "2012-10-28 02:15:00 CET"
[7] "2012-10-28 02:30:00 CET" "2012-10-28 02:45:00 CET"
[9] "2012-10-28 03:00:00 CET" "2012-10-28 03:15:00 CET"
time_seq_03
[1] "2012-10-28 02:00:00 CEST" "2012-10-28 02:15:00 CEST"
[3] "2012-10-28 02:30:00 CEST" "2012-10-28 02:45:00 CET"
[5] "2012-10-28 02:00:00 CEST" "2012-10-28 02:15:00 CEST"
[7] "2012-10-28 02:30:00 CEST" "2012-10-28 02:45:00 CET"
[9] "2012-10-28 03:00:00 CET" "2012-10-28 03:15:00 CET"
POSIXct 序列的创建确实可以正常工作 (time_seq_01) 也可以转换为字符 (time_seq_02)。但是,从字符转换回 POSIXct 会产生错误的时区 (CET/CEST) 值 (time_seq_03)。当对这些元素进行排序时,可以清楚地看到这一点:
sort(time_seq_01)
[1] "2012-10-28 02:00:00 CEST" "2012-10-28 02:15:00 CEST"
[3] "2012-10-28 02:30:00 CEST" "2012-10-28 02:45:00 CEST"
[5] "2012-10-28 02:00:00 CET" "2012-10-28 02:15:00 CET"
[7] "2012-10-28 02:30:00 CET" "2012-10-28 02:45:00 CET"
[9] "2012-10-28 03:00:00 CET" "2012-10-28 03:15:00 CET"
sort(time_seq_03)
[1] "2012-10-28 02:00:00 CEST" "2012-10-28 02:00:00 CEST"
[3] "2012-10-28 02:15:00 CEST" "2012-10-28 02:15:00 CEST"
[5] "2012-10-28 02:30:00 CEST" "2012-10-28 02:30:00 CEST"
[7] "2012-10-28 02:45:00 CET" "2012-10-28 02:45:00 CET"
[9] "2012-10-28 03:00:00 CET" "2012-10-28 03:15:00 CET"
这会导致许多问题,例如在按这些时间戳合并对象时。有没有办法克服这个问题?
我使用的系统:
Windows 7 64bit
R version 2.15.1 (2012-06-22)
Platform: x86_64-pc-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=German_Austria.1252 LC_CTYPE=German_Austria.1252
[3] LC_MONETARY=German_Austria.1252 LC_NUMERIC=C
[5] LC_TIME=German_Austria.1252
attached base packages:
[1] tools stats graphics grDevices utils datasets methods
[8] base
other attached packages:
[1] pkgtools_0.1-3 roxygen2_2.2.2 digest_0.5.2 rj_1.1.0-4
loaded via a namespace (and not attached):
[1] brew_1.0-6 plyr_1.7.1 rj.gd_1.1.0-1 stringr_0.6.1
【问题讨论】:
-
你的
sessionInfo()是什么?你读过?POSIXct的警告部分吗? -
我在上面的问题中添加了我的会话信息
-
是否禁止在
as.POSIXct中使用tz参数?这可以设置,允许您控制时区。 -
除了@JoshuaUlrich 提到的警告部分,还有
?as.POSIXct的详细信息部分,它几乎完全解决了这个问题。 -
按照建议,我查看了“?POSIXct”的推荐部分,并使用“Sys.setenv”设置了“TZ”变量。这并没有改变任何东西。我也在一台 linux 机器上构建了这个问题,得到了类似的结果。