【发布时间】:2018-04-27 16:50:13
【问题描述】:
我的数据框 df 的每一行中都有以下文本作为示例:
[{'id': 16, 'name': 'Soccer'}, {'id': 35, 'name': 'Basketball'}, {'id': 10751, 'name': 'Boxing'}]
有没有办法从这个文本中提取单词(足球、篮球、拳击)?抱歉,我是 R 中文本分析的新手。
【问题讨论】:
-
stringr::str_extract_all(string,"\\w+(?='\\})")应该可以工作 -
它有效,但给了我类似 c("Soccer", "Basketball", "Boxing") 的答案。我怎样才能使它成为“足球”、“篮球”、“拳击”?
-
只做
unlist(stringr::str_extract_all(string,"\\w+(?='\\})"))