【发布时间】:2013-07-25 22:00:34
【问题描述】:
我导入了一些没有列名的数据,所以现在我只有超过一百万行和 1 列(而不是 5 列)。
每一行的格式如下:
x <- "2012-10-19T16:59:01-07:00 192.101.136.140 <190>Oct 19 2012 23:59:01: %FWSM-6-305011: Built dynamic tcp translation from Inside:10.2.45.62/56455 to outside:192.101.136.224/9874"
strsplit( x , split = c(" ", " ", "%", " "))
得到了
[[1]]
[1] "2012-10-19T16:59:01-07:00" "192.101.136.140"
[3] "<190>Oct" "19"
[5] "2012" "23:59:01:"
[7] "%FWSM-6-305011:" "Built"
[9] "dynamic" "tcp"
[11] "translation" "from"
[13] "Inside:10.2.45.62/56455" "to"
[15] "outside:192.101.136.224/9874"
我知道这与回收 split 参数有关,但我似乎不知道如何获得它:
[[1]]
[1] "2012-10-19T16:59:01-07:00" "192.101.136.140"
[3] "<190>Oct 19 2012 23:59:01 "%FWSM-6-305011
[5] Built dynamic tcp translation from Inside:10.2.45.62/56455 to outside:192.101.136.224/9874"
作为第五个元素,每一行都有不同的消息,但在第四个元素之后,我只想将字符串的其余部分保持在一起。
任何帮助将不胜感激。
【问题讨论】:
-
您似乎(错误地)认为分割向量项是按顺序应用的。
-
这是真的。感谢您清理它