【发布时间】:2017-08-15 02:30:12
【问题描述】:
我的 csv 中有一个列,其中包含一个字段“功能”。字段具有这种格式的数据
{""Air conditioning"",""Elevator"",""Smoke detector""}
{""Air conditioning"",""Railing Lights"",""Smoke detector""}
{""Air conditioning"",""Washer"",""Dryer"",""Smoke detector""}
它们是 20000 条记录,这些字符串位于“特征”字段中,没有任何特定顺序。
如何将它们拆分为不同的列,以使所有“空调”都属于第一列,电梯都属于第二列,依此类推。
a b c d
air conditioning elevators smokedetectors
air conditioning elevators smokedetectors washer
air conditioning elevators smokedetectors washer
【问题讨论】:
-
检查
?cSplit来自splitstackshape包。 -
您可以只使用
read.csv(text = gsub('[{}]', '', txt), header = FALSE, quote = '""'),其中txt是上面的文本作为单个字符串
标签: r dplyr text-mining stringr text-analysis