【发布时间】:2020-10-04 13:13:09
【问题描述】:
我有一个包含 2 列的数据框,其中第一列列出了公司,第二列是多个日期和公司名称的字符串,如下所示:
data=data.frame('Company'=(c("A","B","C")),
'Bank'=c("1/13/2020 Bank A 5/12/2020 Bank H C 11/9/2020 HelloBank",
"2/14/2020 HopeBank 1/9/2020 Liberty Bank SA",
"10/18/2020 Securities"))
我想将“银行”列分成多列日期和银行名称,这样:
data=data.frame('Company'=(c("A","B","C")),
"Date1"=(c("1/13/2020","2/14/2020","10/18/2020")),
'Bank1'=c("Bank A", "HopeBank","Securities"),
"Date2"=(c("5/12/2020","1/9/2020",NA)),
'Bank2'=c("Bank H C", "Liberty Bank SA",NA),
"Date3"=(c("11/9/2020 ",NA,NA)),
'Bank3'=c("HelloBank", NA,NA))
我尝试过使用 library(stringr),但日期的格式并不一致。另外,我不知道最终数据帧中需要多少变量,并且“银行”列中的一些字符串很长(最多 824 个 nchar)。
我也尝试过使用与 tidyr 分开但没有成功。
【问题讨论】: