【发布时间】:2021-03-16 08:49:29
【问题描述】:
我的 CSV 文件是这样的
col3 和 col4 的长度总是相同的;
col1,col2,col3,col4
1,2,"[1,2,3]","[1.2,2.3,2.1]"
1,3,"[1,2]","[2.5,2.6]"
2,1,"[1,2,3,4]","[1,2,3,4,5]"
3,1,"[10]","[-0.2]"
这是我的数据结构
structure(list(col1 = c(1L, 1L, 2L, 3L), col2 = c(2L, 3L, 1L,
1L), col3 = c("[1,2,3]", "[1,2]", "[1,2,3,4]", "[10]"), col4 = c("[1.2,2.3,2.1]",
"[2.5,2.6]", "[1,2,3,4,5]", "[-0.2]")), row.names = c(NA, -4L
), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x323ce50>)
我需要像这样取消嵌套后的数据
col1,col2,col3,col4
1,2,1,1.2
1,2,2,2.3
1,2,3,2.1
1,3,1,2.5
1,3,2,2.6
....
我应该如何处理这些数据?
【问题讨论】:
-
在 data.table 的
fread函数中可以快速读取此类数据而无需额外的后处理,对于该 FR 的状态,请在此处查看/upvote github.com/Rdatatable/data.table/issues/1162 -
值得注意的是,data.table的
fwrite中已经可以写入这类数据了
标签: r dataframe data.table tidyr