【发布时间】:2018-08-21 14:45:06
【问题描述】:
读取 HTML 表格后,我的name 列出现,记录如下:
\n\t\t\t\t\t\t\t\t\t\t\t\t\tMike Moon\n\t\t\t\t\t\t\t\t
以下代码无法在名字和姓氏列中生成正确的值
separate(data=nametable, col = Name, into = c("First","Last"), sep= " ")
奇怪的是,First 列是空白的,而 Last 列只包含此人的名字。
我怎样才能正确将此列转换为所需的First 和Last 列(即...
First Last
Mike Moon
@r2evans 推荐的数据示例,如下面的正确答案代码所示:
nametable <- data.frame(Name="\n\t\t\t\t\t\t\t\t\t\t\t\t\tMike Moon\n\t\t\t\t\t\t\t\t", stringsAsFactors=FALSE)
【问题讨论】:
-
请提出这个问题reproducible。这首先要提供可重用的数据,例如
dput(head(nametable))。下一步是确保你包含所有非基础包,我假设你的意思是tidyr::separate。 -
如果我只用这个字符串创建一个小标题,
tidyr::separate用于获取名字和姓氏;他们每个人都有很多转义字符。因此,您的帖子中可能缺少一些东西来重现问题 -
@r2evans 感谢您的建议和快速回答。我已将您的答案代码中反映的示例数据添加到原始问题中。
标签: r text-mining stringr